CN112818103B - 智能对话的交互方法、装置和电子设备 - Google Patents

智能对话的交互方法、装置和电子设备 Download PDF

Info

Publication number
CN112818103B
CN112818103B CN202110148246.3A CN202110148246A CN112818103B CN 112818103 B CN112818103 B CN 112818103B CN 202110148246 A CN202110148246 A CN 202110148246A CN 112818103 B CN112818103 B CN 112818103B
Authority
CN
China
Prior art keywords
information
picture
context
field value
specified field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110148246.3A
Other languages
English (en)
Other versions
CN112818103A (zh
Inventor
郭一贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ant Fortune Shanghai Financial Information Service Co ltd
Original Assignee
Ant Fortune Shanghai Financial Information Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ant Fortune Shanghai Financial Information Service Co ltd filed Critical Ant Fortune Shanghai Financial Information Service Co ltd
Priority to CN202110148246.3A priority Critical patent/CN112818103B/zh
Publication of CN112818103A publication Critical patent/CN112818103A/zh
Application granted granted Critical
Publication of CN112818103B publication Critical patent/CN112818103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本说明书提出了一种智能对话的交互方法、装置和电子设备,其中,上述智能对话的交互方法包括:在智能对话的对话页中,获取用户发送的图片,并获取上述图片的上文或下文信息;根据上述上文或下文信息中的关键词,获取待识别的指定字段;然后,对上述图片进行识别,从上述图片的识别结果中获取上述指定字段对应的指定字段值,再根据上述指定字段值进行查询,获得上述指定字段值对应的信息,最后展示上述指定字段值对应的信息。

Description

智能对话的交互方法、装置和电子设备
【技术领域】
本说明书涉及互联网技术领域,尤其涉及一种智能对话的交互方法、装置和电子设备。
【背景技术】
人工智能(Artificial Intelligence;以下简称:AI),是目前研究和开发用于模拟、延伸以及扩展人类智能的一门新兴科学技术。其中,AI的主要研究目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,比如时下出现的智能对话系统便是AI技术的一个实际应用。
现有相关技术中,智能对话系统在接收到用户发起的对话后,可以自动对该对话进行回答,在这一来一往的发起对话与回复对话的交互过程中,便形成了人与机器之间的对话式交互。
对话式交互是以类似即时通讯的交互方式,实现人机交互的方式,在对话式交互中,机器需要读取用户发送的图片中的有效信息,然后根据读取的信息进行反馈,从而达到类人沟通的效果。
【发明内容】
本说明书实施例提供了一种智能对话的交互方法、装置和电子设备,以实现结合具体的业务场景和实现需求,对图片中的字段进行动态识别。
第一方面,本说明书实施例提供一种智能对话的交互方法,包括:
在智能对话的对话页中,获取用户发送的图片,并获取所述图片的上文或下文信息;
根据所述上文或下文信息中的关键词,获取待识别的指定字段;
对所述图片进行识别,从所述图片的识别结果中获取所述指定字段对应的指定字段值;
根据所述指定字段值进行查询,获得所述指定字段值对应的信息;
展示所述指定字段值对应的信息。
其中一种可能的实现方式中,所述获取用户发送的图片,并获取所述图片的上文或下文信息包括:
如果所述图片为所述用户发送的第一条查询请求,则获取所述图片的下文信息;或者,
如果所述图片不是所述用户发送的第一条查询请求,则获取所述图片的上文信息。
其中一种可能的实现方式中,所述根据所述上文或下文信息中的关键词,获取待识别的指定字段之前,还包括:
对所述上文或下文信息进行分词;
根据分词结果,获得所述上文或下文信息中的关键词;
所述根据所述上文或下文信息中的关键词,获取待识别的指定字段包括:
根据预先设置的对应关系,获取与所述上文或下文信息中的关键词对应的待识别的指定字段;其中,所述对应关系包括上文或下文信息中的关键词与待识别的指定字段的对应关系。
其中一种可能的实现方式中,所述对所述图片进行识别包括:
通过光学字符识别对所述图片进行识别。
其中一种可能的实现方式中,所述根据所述指定字段值进行查询,获得所述指定字段值对应的信息之后,还包括:
根据所述图片的上文或下文信息,获取查询字段;
从所述指定字段值对应的信息中获取所述查询字段对应的查询字段值;
则,所述展示的信息中包括所述查询字段值。
其中一种可能的实现方式中,所述展示所述指定字段值对应的信息包括:
将所述指定字段值对应的信息,按照预先设置的前端展示形式,展示在所述对话页中。
上述智能对话的交互方法中,在智能对话的对话页中,获取用户发送的图片,并获取上述图片的上文或下文信息;根据上述上文或下文信息中的关键词,获取待识别的指定字段;然后,对上述图片进行识别,从上述图片的识别结果中获取上述指定字段对应的指定字段值,再根据上述指定字段值进行查询,获得上述指定字段值对应的信息,最后展示上述指定字段值对应的信息,从而可以实现根据用户输入的图片的上文或下文信息中的关键词,确定图片识别需要识别的指定字段,可以实现结合具体的业务场景和实现需求,对图片中的字段进行动态识别。
第二方面,本说明书实施例提供一种智能对话的交互装置,包括:
获取模块,用于在智能对话的对话页中,获取用户发送的图片,并获取所述图片的上文或下文信息;以及根据所述上文或下文信息中的关键词,获取待识别的指定字段;
识别模块,用于对所述图片进行识别,从所述图片的识别结果中获取所述指定字段对应的指定字段值;
查询模块,用于根据所述指定字段值进行查询,获得所述指定字段值对应的信息;
展示模块,用于展示所述指定字段值对应的信息。
其中一种可能的实现方式中,所述获取模块,具体用于当所述图片为所述用户发送的第一条查询请求时,获取所述图片的下文信息;或者,当所述图片不是所述用户发送的第一条查询请求时,获取所述图片的上文信息。
其中一种可能的实现方式中,所述装置还包括:分词模块;
分词模块,用于在所述获取模块获取待识别的指定字段之前,对所述上文或下文信息进行分词;
所述获取模块,还用于根据所述分词模块的分词结果,获得所述上文或下文信息中的关键词;
所述获取模块,具体用于根据预先设置的对应关系,获取与所述上文或下文信息中的关键词对应的待识别的指定字段;其中,所述对应关系包括上文或下文信息中的关键词与待识别的指定字段的对应关系。
其中一种可能的实现方式中,所述识别模块,具体用于通过光学字符识别对所述图片进行识别。
其中一种可能的实现方式中,所述获取模块,还用于在所述查询模块根据所述指定字段值进行查询,获得所述指定字段值对应的信息之后,根据所述图片的上文或下文信息,获取查询字段;以及从所述指定字段值对应的信息中获取所述查询字段对应的查询字段值;
则,所述展示模块展示的信息中包括所述查询字段值。
其中一种可能的实现方式中,所述展示模块,具体用于将所述指定字段值对应的信息,按照预先设置的前端展示形式,展示在所述对话页中。
第三方面,本说明书实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面提供的方法。
第四方面,本说明书实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面提供的方法。
应当理解的是,本说明书的第二~第四方面与本说明书的第一方面的技术方案一致,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
【附图说明】
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书智能对话的交互方法一个实施例的流程图;
图2(a)~图2(b)为本说明书智能对话的交互方法中智能对话的对话页一个实施例的示意图;
图2(c)为本说明书智能对话的交互方法中智能对话的对话页另一个实施例的示意图;
图3为本说明书智能对话的交互方法另一个实施例的流程图;
图4为本说明书智能对话的交互方法再一个实施例的流程图;
图5为本说明书智能对话的交互方法再一个实施例的流程图;
图6为本说明书智能对话的交互方法再一个实施例的流程图;
图7为本说明书智能对话的交互装置一个实施例的结构示意图;
图8为本说明书智能对话的交互装置另一个实施例的结构示意图;
图9为本说明书电子设备一个实施例的结构示意图。
【具体实施方式】
为了更好的理解本说明书的技术方案,下面结合附图对本说明书实施例进行详细描述。
应当明确,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本说明书保护的范围。
在本说明书实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
在对话式交互中,机器需要读取用户发送的图片中的有效信息,然后根据读取的信息进行反馈,从而达到类人沟通的效果,现有相关技术中,机器仅能对图片中的固定字段进行识别,无法结合具体的业务场景和实现需求,对图片中的字段实现动态识别。
在本说明书实施例中,机器可以为能够与用户进行智能对话的设备,例如:云服务器,本说明书实施例对上述机器的具体形式不作限定。
图1为本说明书智能对话的交互方法一个实施例的流程图,如图1所示,上述智能对话的交互方法可以包括:
步骤102,在智能对话的对话页中,获取用户发送的图片,并获取上述图片的上下文信息。
具体地,获取用户发送的图片,并获取上述图片的上文或下文信息可以为:如果上述图片为用户发送的第一条查询请求,则获取上述图片的下文信息;或者,
如果上述图片不是用户发送的第一条查询请求,则获取上述图片的上文信息。
一种实现方式中,参见图2(a)~图2(b),图2(a)~图2(b)为本说明书智能对话的交互方法中智能对话的对话页一个实施例的示意图,如图2(a)所示,箭头21所指的图片即为在智能对话的对话页中,机器获取的用户发送的图片,从图2(a)中可以看出,箭头21所指的图片不是用户发送的第一条查询请求,因此需要获取箭头21所指的图片的上文信息,这里的上文信息包括:用户输入的“我的订单什么时候生效”,以及机器输出的“你想咨询哪笔订单”。在具体实现时,可以预先设置用户的输入内容与机器的输出内容之间的映射关系,这样,在获取用户的输入内容之后,根据预先设置的映射关系,机器即可输出相应的内容。
同样,图2(b)中,箭头22所指的图片即为在智能对话的对话页中,机器获取的用户发送的图片,从图2(b)中可以看出,箭头22所指的图片不是用户发送的第一条查询请求,因此需要获取箭头22所指的图片的上文信息,这里的上文信息包括:用户输入的“我的订单什么时候生效”,以及机器输出的“你想咨询哪笔订单”。
另一种实现方式中,假设用户发送的第一条查询请求为一张图片,参见图2(c),图2(c)为本说明书智能对话的交互方法中智能对话的对话页另一个实施例的示意图,图2(c)中,用户发送的第一条查询请求为箭头25所指的图片,那么获取用户发送的图片之后,机器可以输出“你想咨询什么问题”,这时,假设用户输入“我的订单什么时候生效”,这样,在获取用户发送的图片之后,机器需要获取上述图片的下文信息,这里的下文信息包括:机器输出的“你想咨询什么问题”,以及用户输入的“我的订单什么时候生效”。由于用户的输入内容与机器的输出内容之间的映射关系可以是预先设置好的,因此,当用户输入的第一条查询请求为图片时,机器可以根据映射关系,获得与图片对应的输出内容,然后将输出内容展示在对话页中。
步骤104,根据上述上文或下文信息中的关键词,获取待识别的指定字段。
具体地,在图2(a)~图2(b)中,获取的图片的上文信息均为:用户输入的“我的订单什么时候生效”,以及机器输出的“你想咨询哪笔订单”,假设上述上文信息中的关键词为“订单”,那么待识别的指定字段可以为订单号和/或产品名称等字段;
同样,在图2(c)中,获取的图片的下文信息为:机器输出的“你想咨询什么问题”,以及用户输入的“我的订单什么时候生效”,假设上述下文信息中的关键词为“订单”,那么待识别的指定字段可以为订单号和/或产品名称等字段。
步骤106,对上述图片进行识别,从上述图片的识别结果中获取上述指定字段对应的指定字段值。
以图2(a)~图2(c)为例,假设待识别的指定字段为订单号,那么对图2(a)中箭头21所指的图片进行识别之后,可以从上述图片的识别结果中获取订单号的值;同样对图2(b)中箭头22所指的图片进行识别之后,可以从上述图片的识别结果中获取订单号的值;同样对图2(c)中箭头25所指的图片进行识别之后,可以从上述图片的识别结果中获取订单号的值。
步骤108,根据上述指定字段值进行查询,获得上述指定字段值对应的信息。
具体地,在获取上述指定字段对应的指定字段值之后,可以根据上述指定字段值在数据库中进行查询,获得上述指定字段值对应的信息。这里上述指定字段值对应的信息可以包括上述指定字段值对应的完整信息,举例来说,上述指定字段值对应的信息可以包括订单号、产品名称、订单金额、交易时间和/或订单状态等。
仍以图2(a)~图2(c)为例,在获取订单号的值之后,可以根据上述订单号的值在数据库中进行查询,获得上述订单号的值对应的信息。这里,上述订单号的值对应的信息可以包括:上述订单号的值对应的完整信息,可以包括:订单号、产品名称、订单金额、交易时间和/或订单状态等。
步骤110,展示上述指定字段值对应的信息。
具体地,在获得上述指定字段值对应的信息之后,机器可以在上述智能对话的对话页中展示上述指定字段值对应的信息。
参见图2(a)~图2(c),图2(a)中,箭头23所指的方框即为在对话页中展示的上述指定字段值对应的信息,由于箭头21所指的图片中仅包括一个订单的订单号,因此箭头23所指的方框中仅为一个订单的信息;图2(b)中,箭头24所指的方框即为在对话页中展示的上述指定字段值对应的信息,由于箭头22所指的图片中包括4个订单的订单号,因此箭头24所指的方框中包括4个订单的信息;图2(c)中,箭头26所指的方框即为在对话页中展示的上述指定字段值对应的信息,由于箭头25所指的图片中仅包括一个订单的订单号,因此箭头26所指的方框中仅为一个订单的信息;
上述智能对话的交互方法中,在智能对话的对话页中,获取用户发送的图片,并获取上述图片的上文或下文信息;根据上述上文或下文信息中的关键词,获取待识别的指定字段;然后,对上述图片进行识别,从上述图片的识别结果中获取上述指定字段对应的指定字段值,再根据上述指定字段值进行查询,获得上述指定字段值对应的信息,最后展示上述指定字段值对应的信息,从而可以实现根据用户输入的图片的上文或下文信息中的关键词,确定图片识别需要识别的指定字段,可以实现结合具体的业务场景和实现需求,对图片中的字段进行动态识别。
图3为本说明书智能对话的交互方法另一个实施例的流程图,如图3所示,本说明书图1所示实施例中,步骤104之前还可以包括:
步骤302,对上述上文或下文信息进行分词。
步骤304,根据分词结果,获得上述上文或下文信息中的关键词。
具体地,根据分词结果,可以采用词频-逆文本频率指数(Term Frequency–Inverse Document Frequency;以下简称:TF-IDF)算法、TextRank算法或Word2Vec算法获得上述上文或下文信息中的关键词,本实施例对获得上述上文或下文信息中的关键词所采用的算法不作限定;或者,
也可以预先设置关键词列表,将分词结果与预先设置的关键词列表进行匹配,分词结果中与关键词列表相匹配的分词即为上述上文或下文信息中的关键词。
这样,步骤104可以为:
步骤306,根据预先设置的对应关系,获取与上述上文或下文信息中的关键词对应的待识别的指定字段;其中,上述对应关系包括上文或下文信息中的关键词与待识别的指定字段的对应关系。
举例来说,可以预先设置“订单”与“产品名称”,和/或“订单”与“订单号”的对应关系,那么当上述上文或下文信息中的关键词为“订单”时,就可以根据上述对应关系,获取待识别的指定字段为“产品名称”和/或“订单号”。
图4为本说明书智能对话的交互方法再一个实施例的流程图,如图4所示,本说明书图1所示实施例中,步骤106可以包括:
步骤402,通过光学字符识别(Optical Character Recognition;以下简称:OCR)对上述图片进行识别,从上述图片的识别结果中获取上述指定字段对应的指定字段值。
具体地,通过OCR对上述图片进行识别可以为:
首先,对上述图片进行预处理,预处理主要包括:二值化、噪声去除和倾斜较正等。
其中,二值化是对上述图片的内容进行划分,分为前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了;
噪声去除是根据噪声的特征对上述图片进行去噪;
倾斜较正是对上述图片的方向进行校正,避免上述图片倾斜。
然后,对上述图片进行版面分析,也就是将上述图片进行分段落和/或分行的过程。
接下来,对上述图片进行字符切割,然后对切割后的字符进行识别,最后对识别获得的文字进行版面恢复,获得上述图片的识别结果,最后根据特定的语言上下文的关系,对上述图片的识别结果进行校正。至此,通过OCR对上述图片进行识别的过程就完成了。
图5为本说明书智能对话的交互方法再一个实施例的流程图,如图5所示,本说明书图1所示实施例中,步骤108之后,还可以包括:
步骤502,根据上述图片的上文或下文信息,获取查询字段。
具体地,图2(a)~图2(b)中,上述图片的上文信息为:用户输入的“我的订单什么时候生效”,以及机器输出的“你想咨询哪笔订单”,对上述上文信息进行语义识别,可以确定上述用户的意图为查询订单状态,因此可以获取查询字段为订单状态;
图2(c)中,上述图片的下文信息为:机器输出的“你想咨询什么问题”,以及用户输入的“我的订单什么时候生效”,对上述下文信息进行语义识别,可以确定上述用户的意图为查询订单状态,因此可以获取查询字段为订单状态。
步骤504,从上述指定字段值对应的信息中获取上述查询字段对应的查询字段值。
这样,步骤110所展示的信息中可以包括:上述查询字段值。
参见图2(a)~图2(c),图2(a)中,箭头23所指的方框即为所展示的上述指定字段值对应的信息,可以看出,所展示的信息中包括“当前状态”的值“已生效”,上述“已生效”即为订单状态对应的值。
同样,图2(b)中,箭头24所指的方框即为所展示的上述指定字段值对应的信息,可以看出,所展示的信息中包括每个订单的“当前状态”的值,分别为“已生效”、“处理中”和“处理中”,“已生效”、“处理中”和“处理中”即为订单状态对应的值;
同样,图2(c)中,箭头26所指的方框即为所展示的上述指定字段值对应的信息,可以看出,所展示的信息中包括“当前状态”的值“已生效”,上述“已生效”即为订单状态对应的值。
图6为本说明书智能对话的交互方法再一个实施例的流程图,如图6所示,本说明书图1所示实施例中,步骤110可以为:
步骤602,将上述指定字段值对应的信息,按照预先设置的前端展示形式,展示在上述对话页中。
本实施例中,可以预先设置前端展示形式,在获取上述指定字段值对应的信息之后,将获取的信息按照预先设置的前端展示形式,展示在上述对话页中。
图2(a)中,箭头23所指的方框中展示的信息,就是按照预先设置的前端展示形式,将获取的上述指定字段对应的信息进行排版之后展示的;同样图2(b)中,箭头24所指的方框中展示的信息,也是按照预先设置的前端展示形式,将获取的上述指定字段对应的信息进行排版之后展示的;同样,图2(c)中,箭头26所指的方框中展示的信息,也是按照预先设置的前端展示形式,将获取的上述指定字段对应的信息进行排版之后展示的。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
图7为本说明书智能对话的交互装置一个实施例的结构示意图,如图7所示,上述智能对话的交互装置可以包括:获取模块71、识别模块72、查询模块73和展示模块74;
获取模块71,用于在智能对话的对话页中,获取用户发送的图片,并获取上述图片的上文或下文信息;以及根据上述上文或下文信息中的关键词,获取待识别的指定字段;
识别模块72,用于对上述图片进行识别,从上述图片的识别结果中获取上述指定字段对应的指定字段值;
查询模块73,用于根据上述指定字段值进行查询,获得上述指定字段值对应的信息;
展示模块74,用于展示上述指定字段值对应的信息。
图7所示实施例提供的智能对话的交互装置可用于执行本说明书图1所示方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
图8为本说明书智能对话的交互装置另一个实施例的结构示意图,与图7所示的智能对话的交互装置相比,图8所示的智能对话的交互装置中,获取模块71,具体用于当上述图片为上述用户发送的第一条查询请求时,获取上述图片的下文信息;或者,当上述图片不是上述用户发送的第一条查询请求时,获取上述图片的上文信息。
进一步地,上述智能对话的交互装置还可以包括:分词模块75;
分词模块75,用于在获取模块71获取待识别的指定字段之前,对上述上文或下文信息进行分词;
这时,获取模块71,还用于根据分词模块75的分词结果,获得上述上文或下文信息中的关键词;
获取模块71,具体用于根据预先设置的对应关系,获取与上述上文或下文信息中的关键词对应的待识别的指定字段;其中,上述对应关系包括上文或下文信息中的关键词与待识别的指定字段的对应关系。
本实施例中,识别模块72,具体用于通过OCR对上述图片进行识别。
本实施例中,获取模块71,还用于在查询模块73根据上述指定字段值进行查询,获得上述指定字段值对应的信息之后,根据上述图片的上文或下文信息,获取查询字段;以及从上述指定字段值对应的信息中获取上述查询字段对应的查询字段值;
则,展示模块74展示的信息中包括上述查询字段值。
本实施例中,展示模块74,具体用于将上述指定字段值对应的信息,按照预先设置的前端展示形式,展示在上述对话页中。
图8所示实施例提供的智能对话的交互装置可用于执行本申请图1~图6所示方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
图9为本说明书电子设备一个实施例的结构示意图,如图9所示,上述电子设备可以包括至少一个处理器;以及与上述处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,上述处理器调用上述程序指令能够执行本说明书图1~图6所示实施例提供的智能对话的交互方法。
其中,上述电子设备可以为能够与用户进行智能对话的设备,例如:云服务器,本说明书实施例对上述电子设备的具体形式不作限定。可以理解的是,这里的电子设备即为方法实施例中提到的机器。
图9示出了适于用来实现本说明书实施方式的示例性电子设备的框图。图9显示的电子设备仅仅是一个示例,不应对本说明书实施例的功能和使用范围带来任何限制。
如图9所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器410,存储器430,连接不同系统组件(包括存储器430和处理单元410)的通信总线440。
通信总线440表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器430可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。存储器430可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本说明书各实施例的功能。
具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器430中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本说明书所描述的实施例中的功能和/或方法。
处理器410通过运行存储在存储器430中的程序,从而执行各种功能应用以及数据处理,例如实现本说明书图1~图3所示实施例提供的智能对话的交互方法。
本说明书实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本说明书图1~图6所示实施例提供的智能对话的交互方法。
上述非暂态计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable ProgrammableRead Only Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本说明书操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本说明书的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本说明书的实施例所属技术领域的技术人员所理解。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
需要说明的是,本说明书实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer;以下简称:PC)、个人数字助理(Personal Digital Assistant;以下简称:PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
在本说明书所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本说明书各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本说明书各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory;以下简称:ROM)、随机存取存储器(Random Access Memory;以下简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (10)

1.一种智能对话的交互方法,包括:
在智能对话的对话页中,获取用户发送的图片,并获取所述图片的上文或下文信息;
根据所述上文或下文信息中的关键词,获取待识别的指定字段;
对所述图片进行识别,从所述图片的识别结果中获取所述指定字段对应的指定字段值;
根据所述指定字段值进行查询,获得所述指定字段值对应的信息;
在所述智能对话的对话页中展示所述指定字段值对应的信息;
其中,所述根据所述上文或下文信息中的关键词,获取待识别的指定字段之前,还包括:
对所述上文或下文信息进行分词;
根据分词结果,获得所述上文或下文信息中的关键词;
所述根据所述上文或下文信息中的关键词,获取待识别的指定字段包括:
根据预先设置的对应关系,获取与所述上文或下文信息中的关键词对应的待识别的指定字段;其中,所述对应关系包括上文或下文信息中的关键词与待识别的指定字段的对应关系;
其中,所述根据所述指定字段值进行查询,获得所述指定字段值对应的信息之后,还包括:
根据所述图片的上文或下文信息,获取查询字段;
从所述指定字段值对应的信息中获取所述查询字段对应的查询字段值;
则,展示的信息中包括所述查询字段值;
其中,所述根据分词结果,获得所述上文或下文信息中的关键词包括:
根据分词结果,采用词频-逆文本频率指数算法、TextRank算法或Word2Vec算法获得所述上文或下文信息中的关键词;或者,预先设置关键词列表,将分词结果与预先设置的关键词列表进行匹配,分词结果中与关键词列表相匹配的分词为所述上文或下文信息中的关键词。
2.根据权利要求1所述的方法,其中,所述获取用户发送的图片,并获取所述图片的上文或下文信息包括:
如果所述图片为所述用户发送的第一条查询请求,则获取所述图片的下文信息;或者,
如果所述图片不是所述用户发送的第一条查询请求,则获取所述图片的上文信息。
3.根据权利要求1所述的方法,其中,所述对所述图片进行识别包括:
通过光学字符识别对所述图片进行识别。
4.根据权利要求1-3任意一项所述的方法,其中,所述展示所述指定字段值对应的信息包括:
将所述指定字段值对应的信息,按照预先设置的前端展示形式,展示在所述对话页中。
5.一种智能对话的交互装置,包括:
获取模块,用于在智能对话的对话页中,获取用户发送的图片,并获取所述图片的上文或下文信息;以及根据所述上文或下文信息中的关键词,获取待识别的指定字段;
识别模块,用于对所述图片进行识别,从所述图片的识别结果中获取所述指定字段对应的指定字段值;
查询模块,用于根据所述指定字段值进行查询,获得所述指定字段值对应的信息;
展示模块,用于展示所述指定字段值对应的信息;
其中,所述装置还包括:分词模块;
分词模块,用于在所述获取模块获取待识别的指定字段之前,对所述上文或下文信息进行分词;
所述获取模块,还用于根据所述分词模块的分词结果,获得所述上文或下文信息中的关键词;
所述获取模块,具体用于根据预先设置的对应关系,获取与所述上文或下文信息中的关键词对应的待识别的指定字段;其中,所述对应关系包括上文或下文信息中的关键词与待识别的指定字段的对应关系;
所述获取模块,还用于在所述查询模块根据所述指定字段值进行查询,获得所述指定字段值对应的信息之后,根据所述图片的上文或下文信息,获取查询字段;以及从所述指定字段值对应的信息中获取所述查询字段对应的查询字段值;
则,所述展示模块展示的信息中包括所述查询字段值;
其中,所述获取模块,具体用于根据分词结果,采用词频-逆文本频率指数算法、TextRank算法或Word2Vec算法获得所述上文或下文信息中的关键词;或者,预先设置关键词列表,将分词结果与预先设置的关键词列表进行匹配,分词结果中与关键词列表相匹配的分词为所述上文或下文信息中的关键词。
6.根据权利要求5所述的装置,其中,
所述获取模块,具体用于当所述图片为所述用户发送的第一条查询请求时,获取所述图片的下文信息;或者,当所述图片不是所述用户发送的第一条查询请求时,获取所述图片的上文信息。
7.根据权利要求5所述的装置,其中,
所述识别模块,具体用于通过光学字符识别对所述图片进行识别。
8.根据权利要求5-7任意一项所述的装置,其中,
所述展示模块,具体用于将所述指定字段值对应的信息,按照预先设置的前端展示形式,展示在所述对话页中。
9.一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至4任一所述的方法。
CN202110148246.3A 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备 Active CN112818103B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110148246.3A CN112818103B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110148246.3A CN112818103B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备
CN202010167242.5A CN111061854B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202010167242.5A Division CN111061854B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112818103A CN112818103A (zh) 2021-05-18
CN112818103B true CN112818103B (zh) 2024-02-06

Family

ID=70307909

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010167242.5A Active CN111061854B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备
CN202110148246.3A Active CN112818103B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010167242.5A Active CN111061854B (zh) 2020-03-11 2020-03-11 智能对话的交互方法、装置和电子设备

Country Status (1)

Country Link
CN (2) CN111061854B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095272A (zh) * 2014-05-12 2015-11-25 阿里巴巴集团控股有限公司 基于图像识别的问答处理方法、装置及系统
CN108121821A (zh) * 2018-01-09 2018-06-05 惠龙易通国际物流股份有限公司 一种机器客服服务方法、设备及计算机存储介质
CN108345692A (zh) * 2018-03-16 2018-07-31 北京京东尚科信息技术有限公司 一种自动问答方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101622111B1 (ko) * 2009-12-11 2016-05-18 삼성전자 주식회사 대화 시스템 및 그의 대화 방법
US9171088B2 (en) * 2011-04-06 2015-10-27 Google Inc. Mining for product classification structures for internet-based product searching
US9852188B2 (en) * 2014-06-23 2017-12-26 Google Llc Contextual search on multimedia content
CN104239459B (zh) * 2014-09-02 2018-03-09 百度在线网络技术(北京)有限公司 语音搜索方法、装置和系统
CN105913039B (zh) * 2016-04-26 2020-08-18 北京光年无限科技有限公司 基于视觉和语音的对话数据交互处理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095272A (zh) * 2014-05-12 2015-11-25 阿里巴巴集团控股有限公司 基于图像识别的问答处理方法、装置及系统
CN108121821A (zh) * 2018-01-09 2018-06-05 惠龙易通国际物流股份有限公司 一种机器客服服务方法、设备及计算机存储介质
CN108345692A (zh) * 2018-03-16 2018-07-31 北京京东尚科信息技术有限公司 一种自动问答方法和系统

Also Published As

Publication number Publication date
CN111061854A (zh) 2020-04-24
CN111061854B (zh) 2021-02-26
CN112818103A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN110069608B (zh) 一种语音交互的方法、装置、设备和计算机存储介质
CN109543058B (zh) 用于检测图像的方法、电子设备和计算机可读介质
US20210042504A1 (en) Method and apparatus for outputting data
CN109241286B (zh) 用于生成文本的方法和装置
CN111522927A (zh) 基于知识图谱的实体查询方法和装置
CN110377750B (zh) 评论生成及评论生成模型训练方法、装置及存储介质
CN113590776A (zh) 基于知识图谱的文本处理方法、装置、电子设备及介质
CN114998484A (zh) 音视频生成方法、装置、计算机设备及存储介质
US20190147104A1 (en) Method and apparatus for constructing artificial intelligence application
CN110019906B (zh) 用于显示信息的方法和装置
CN110232920B (zh) 语音处理方法和装置
CN112182255A (zh) 用于存储媒体文件和用于检索媒体文件的方法和装置
EP3564833B1 (en) Method and device for identifying main picture in web page
CN112818103B (zh) 智能对话的交互方法、装置和电子设备
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN110472055B (zh) 用于标注数据的方法和装置
CN114417850A (zh) 信息抽取方法、装置、存储介质及电子设备
CN112542163B (zh) 智能语音交互方法、设备及存储介质
CN114238689A (zh) 视频生成方法、装置、电子设备、存储介质和程序产品
CN109460511B (zh) 一种获取用户画像的方法、装置、电子设备及存储介质
CN110276001B (zh) 盘点页识别方法、装置、计算设备和介质
CN114118072A (zh) 文档结构化方法、装置、电子设备和计算机可读存储介质
CN112487164A (zh) 一种人工智能交互方法
CN114281981B (zh) 新闻简报的生成方法、装置和电子设备
CN109857838B (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211229

Address after: Room 602, No. 618, Wai Road, Huangpu District, Shanghai 200010

Applicant after: Ant fortune (Shanghai) Financial Information Service Co.,Ltd.

Address before: 801-11, Section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province 310007

Applicant before: Alipay (Hangzhou) Information Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant