CN109543016A - 一种数据处理方法、装置和用于数据处理的装置 - Google Patents
一种数据处理方法、装置和用于数据处理的装置 Download PDFInfo
- Publication number
- CN109543016A CN109543016A CN201811362486.8A CN201811362486A CN109543016A CN 109543016 A CN109543016 A CN 109543016A CN 201811362486 A CN201811362486 A CN 201811362486A CN 109543016 A CN109543016 A CN 109543016A
- Authority
- CN
- China
- Prior art keywords
- intended
- search result
- request
- field
- result items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:接收请求;确定所述请求对应的至少两种领域意图;依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。本发明实施例可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
背景技术
随着人工智能技术、物联网技术的快速发展和大数据处理以及计算能力的不断提升,智能对话作为一种结合机器智能和会话的新型产品形态,以更好地连接人和服务、人和信息为目标,通过和用户使用自然语言进行多轮交互的方式,为用户带来了新的人性化服务体验和服务便利。具体地,智能对话系统可以接收用户输入的查询请求,确定该查询请求对应的查询意图,并依据对应的查询意图,确定该查询请求对应的回复。
现有的智能对话系统,可以依据该查询请求所涉及的领域,确定查询意图。在该查询请求涉及多个领域的情况下,将得到多个查询意图;通常的做法是:依据多个领域对应的预设优先级,从多个查询意图中确定出最优查询意图,并依据最优查询意图,确定该查询请求对应的回复。例如,假设查询请求“七里香”对应的查询意图可以包括:百科<七里香是一种内服的药疗药品>;百科<七里香是一首来自歌手B的歌曲>;音乐<播放七里香这首歌>等,假设预设优先级从高到低的顺序依次为:百科<歌曲>、百科<药品>、音乐,则可以确定最优查询意图为:百科<七里香是一首来自歌手B的歌曲>。
在实际应用中,预设优先级通常是人为设定的、较为固定的优先级,这使得依据预设优先级得到的最优查询意图也是较为固定的;然而,用户的查询请求对应的查询意图往往具有多样性。例如,在查询请求相同的情况下,不同的用户可能具有不同的查询意图;又如,同一个用户在不同的时间段,可能通过相同的查询请求表征不同的查询意图。因此,现有的智能对话系统提供的较为固定的最优查询意图,很有可能与用户的实际查询意图不匹配,也即不符合用户的需求。
发明内容
本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
本发明实施例公开了一种数据处理方法,包括:
接收请求;
确定所述请求对应的至少两种领域意图;
依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
另一方面,本发明实施例公开了一种数据处理装置,包括:
请求接收模块,用于接收请求;
第一确定模块,用于确定所述请求对应的至少两种领域意图;
第二确定模块,用于依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;以及
输出模块,用于输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
再一方面,本发明实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收请求;
确定所述请求对应的至少两种领域意图;
依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的数据处理方法。
本发明实施例包括以下优点:
本发明实施例依据请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;由于所述请求对应的搜索结果数据可以反映搜索环境中众多用户的搜索需求,因此,本发明实施例依据上述搜索结果数据得到的目标领域意图,可以反映搜索环境中大多数用户的搜索需求,因此可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种数据处理方法的应用环境的结构示意图;
图2是本发明的一种数据处理方法实施例的步骤流程图;
图3是本发明的一种数据处理装置实施例的结构框图;
图4是本发明的一种用于数据处理的装置800的框图;及
图5是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种数据处理方法,该方法可以包括:接收请求;确定所述请求对应的至少两种领域意图;依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;以及输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
本发明实施例中,领域可以指数据的范围。可选地,领域可以指数据的应用场景或者类别。领域可以包括但不限于:百科、新闻、音乐、视频、影视、游戏、体育、电商、教育学习、FM(调频,Frequency Modulation)、SMS(短消息服务,Short Messaging Service)、控制、旅游、书籍、天气、图库等等。可以理解,可以对领域进行细分,以得到细分领域。例如,百科领域的细分领域可以包括:百科多义词分别对应的义项等。
在实际应用中,领域的数据可由运营商提供。例如,运营商提供的数据可以包括:领域对象、以及领域对象的属性等。领域对象可以指领域内的对象,领域对象可以是一个具体事物或概念。
领域对象的属性可以指领域对象的性质。领域对象的属性可以包括:领域属性,该领域属性可以指与领域相关的属性。例如,音乐领域的领域对象可以与音乐相关,音乐领域的领域对象可以包括:歌曲、歌手、制作人、作词人、编曲等。领域对象的属性还可以包括:领域对象的介绍属性等。上述介绍属性可以包括但不限于:基本属性、以及扩展属性等。其中,基本属性可以包括:名称等,扩展属性可以包括:评价等信息。可选地,可以通过领域对象的关键词表征领域对象的属性。
在实际应用中,请求可能对应有至少两种领域意图。例如,在请求对应人物(如知名人物)、多义词、或者影视节目的情况下,请求可能对应有至少两种领域意图。
在本申请的一种应用示例中,人物A的用户身份可以包括:运动员,则其对应的至少领域意图可以包括:百科意图。假设人物A近期在某个综艺节目上唱了一首歌曲,则人物A对应的领域意图可以包括:新闻意图,该新闻意图可以通过新闻的方式,描述人物A在综艺节目上唱歌的事件。假设人物A演唱的视频被发布,则该人物A对应的领域意图还可以包括:视频意图。假设人物A演唱的歌曲被发布,则该人物A对应的领域意图还可以包括:音乐意图。
在本申请的一种应用示例中,“七里香”为多义词,其含义的类型可以包括:药品、歌曲、旅游景点、书籍等,则“七里香”可以对应至少两种领域意图。
本发明实施例依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;由于所述请求对应的搜索结果数据可以反映搜索环境中众多用户的搜索需求,因此,本发明实施例依据上述搜索结果数据得到的目标领域意图,可以反映搜索环境中大多数用户的搜索需求,因此可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
具体地,上述搜索结果数据可以从概率学的角度来获取大多数用户的喜好特征,并获取符合大多数用户的喜好特征的搜索结果数据,因此可以反映搜索环境中大多数用户的搜索需求。
可选地,上述搜索结果数据可以获取时效性较强的信息,作为搜索结果项,和/或,上述搜索结果数据中多个搜索结果项的排序因子可以包括:时效性,使得上述搜索结果数据可以反映不同的搜索结果项在时效性方面的差异,而搜索结果项可以与领域意图相应。本发明实施例依据上述搜索结果数据得到的目标领域意图,可以具有较强的时效性;而大多数用户关注的是时效性较强的信息。因此,本发明实施例可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
在本发明的一种应用示例1中,假设请求“七里香”对应的领域意图包括:百科意图1<七里香是一种内服的药疗药品>;百科意图2<七里香是一首来自歌手B的歌曲>;音乐意图1<播放七里香这首歌>等。假设以“七里香”为搜索关键词进行搜索得到的搜索结果数据中,排在第一位的搜索结果项对应音乐意图,则可以按照大多数用户对于领域意图的需求,确定目标领域意图为:音乐意图<播放七里香这首歌>,进而可以依据音乐意图<播放七里香这首歌>,确定对应的反馈结果。
在本发明的一种应用示例2中,假设请求“人物A”对应的领域意图包括:百科意图<人物A是一个运动员>;新闻意图<人物A最近在综艺节目上演唱了一首歌曲>;视频意图<人物A演唱歌曲的视频>等。假设以“人物A”为搜索关键词进行搜索得到的搜索结果数据中,排在第一位的搜索结果项对应新闻意图,则可以按照大多数用户对于领域意图的需求,确定目标领域意图为:新闻意图<人物A最近在综艺节目上演唱了一首歌曲>,进而可以依据新闻意图<人物A最近在综艺节目上演唱了一首歌曲>,确定对应的反馈结果。
本发明实施例适用的场景可以包括:对话场景、问答场景等。其中,对话场景可以为智能对话场景、或者普通对话场景。其中,智能对话场景可用于在人与计算机之间生成自然无缝对接的对话,智能对话场景下的请求可以为用户发送的请求,普通对话场景下的请求可以为通信对端发送的请求。问答场景下的请求可以为用户发布的问题,例如,用户在问答网站发布的问题等。可以理解,本发明实施例的请求可以为任意场景下的请求,本发明实施例对于具体的场景和请求不加以限制。
本申请实施例提供的数据处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。
可选地,客户端100可以运行在设备上,例如,客户端100可以为设备上运行的APP,如短信息APP、电子商务APP、即时通讯APP、输入法APP、或者操作系统自带的APP等,本申请实施例对于客户端所对应的具体APP不加以限制。可选地,上述客户端100可以基于人工智能技术实现控制功能。
可选地,上述设备具体可以包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio LayerIII)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts GroupAudio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备、智能音箱等等。可以理解,本申请实施例对于具体的设备不加以限制。
方法实施例
参照图2,示出了本发明的一种数据处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤201、接收请求;
步骤202、确定所述请求对应的至少两种领域意图;
步骤203、依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
步骤204、输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
图2所示实施例的至少一个步骤可由服务器和/或客户端执行,当然本发明实施例对于各个步骤的具体执行主体不加以限制。
在步骤201中,客户端可以通过语音输入方式、键盘输入方式等输入方式,接收用户输入的请求。或者,客户端可以接收通信对端发送的信息,并依据该信息得到请求。可以理解,本发明实施例对于具体的请求不加以限制。
本发明实施例可以假定请求呈现为文本形式。对于呈现为非文本形式的请求,可以将非文本形式的请求转换为文本形式的请求。例如,可以通过语音识别技术,将语音形式的请求转换为文本形式的请求。又如,可以对图片形式的请求进行OCR(光学字符识别,Optical Character Recognition),以得到文本形式的请求。
步骤202中,领域意图可以指与领域相关的意图。
根据一种实施例,步骤202确定所述请求对应的至少两种领域意图的过程具体可以包括:依据所述请求与领域对象的关键词之间的匹配度,确定所述请求对应的至少两种领域意图。具体的,上述匹配度可以是依据所述请求包括的核心关键词与领域对象的关键词之间的匹配度。
核心关键词可以指压缩表示了请求对应文本重要信息和核心内容的词语。可选地,可以采用抽取方法,从请求对应文本中抽取核心关键词。相应的抽取方法可以包括但不限于:TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆向文件频率)算法、Key Graph(关键图)算法、Text Rank(文本排名)算法、语言分析的方法等,其中语言分析的方法可以包括词法、句法及语义分析等方法。
领域对象的关键词可用于表征领域对象的属性。在实际应用中,可以对请求进行分词,并将得到的分词结果(如核心关键词)与领域对象的关键词进行匹配,若匹配成功,则可以依据领域对象对应的领域,确定所述请求对应的领域意图。
例如,百科领域的领域对象包括:百科对象1<七里香是一种内服的药疗药品>、以及百科对象2<七里香是一首来自歌手B的歌曲>;音乐领域的领域对象包括:音乐对象1<播放七里香这首歌>。百科对象1、百科对象2和音乐意图1的关键词均可以包括:“七里香”;因此,在请求中包括“七里香”的情况下,可以认为请求对应的领域意图包括:百科意图1、百科意图2和音乐意图等。
根据另一种实施例,步骤202确定所述请求对应的至少两种领域意图的过程具体可以包括:利用分类模型,确定所述请求对应的至少两种领域意图。
上述分类模型可以为机器学习模型。从广义上讲,机器学习是一种能够赋予机器学习的能力,让它以此完成直接编程无法完成的功能的方法。但从实践的意义上讲,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。机器学习方法可以包括:决策树方法、线性回归方法、逻辑回归方法、神经网络方法、k近邻方法等,可以理解,本发明实施例对于具体的机器学习方法不加以限制。
上述分类模型可以具有领域意图的分类能力。在实际应用中,可以提供N(N为自然数)种领域意图,而上述分类模型可以从N种领域意图中确定出请求对应的至少两种领域意图。例如,将“七里香”输入分类模型,可以得到该分类模型输出的结果:百科意图1、百科意图2和音乐意图等。
本申请实施例的一个目的在于,在上述请求对应至少两种领域意图的情况下,确定出更符合用户的需求的目标领域意图。在上述请求仅仅对应一种领域意图的情况下,可以直接将这一种领域意图作为目标领域意图。
步骤203中,所述搜索结果数据可以是:以所述请求作为搜索关键词执行搜索操作得到的搜索结果数据;也可以是:以所述请求的核心关键词作为搜索关键词执行搜索操作得到的搜索结果数据。
上述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。上述排序位置可以为绝对位置、或者相对位置。例如,多个搜索结果项为排在前M(M为自然数)位的搜索结果项,则M个搜索结果项的对应的位置可以为:每个搜索结果项分别在排序结果中的位置,排序结果可以对应从前到后的顺序。
上述搜索结果数据可以获取时效性较强的信息,作为搜索结果项,和/或,上述搜索结果数据中多个搜索结果项的排序因子可以包括:时效性,使得上述搜索结果数据可以反映不同的搜索结果项在时效性方面的差异,而搜索结果项可以与领域意图相应。本发明实施例依据上述搜索结果数据得到的目标领域意图,可以具有较强的时效性;而大多数用户关注的是时效性较强的信息,因此,本发明实施例可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
本发明实施例可以提供从所述至少两种领域意图中确定出目标领域意图的如下技术方案:
技术方案1
技术方案1中,上述搜索结果数据可以包括:多个搜索结果项、以及,每个搜索结果项对应的排序位置;
则步骤203从所述至少两种领域意图中确定出目标领域意图,具体可以包括:针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;依据所述结果特征,确定出所述每个搜索结果项对应的匹配度最高的第一领域意图;依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项对应的第一领域意图,从所述至少两种领域意图中确定出目标领域意图。
本发明实施例的搜索结果项的类型可以包括:网页、文档、应用程序、音乐、或者电视节目等。结果特征可用于表征搜索结果项的特性;不同类型的搜索结果项对应的结果特征可以相同,也可以不相同。例如,网页或者文档的结果特征可以表征网页或者文档的主题等;应用程序的结果特征可以表征应用程序的功能等;音乐的结果特征可以包括:作词人、歌手、以及表达的情感等特征。电视节目的结果特征可以包括:主持人、或者嘉宾、或者节目的主题等,其中主题可以指一个对象所要表现的中心思想,泛指主要内容。
可选地,上述针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征,具体可以包括:从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息可以包括如下信息中的至少一种:标题、摘要、领域属性和页面内容。
其中,标题和摘要可以为搜索结果页中针对搜索结果项展示的内容。
领域属性可以指与领域相关的属性,领域属性可以说明一个搜索结果项与哪个领域相关。例如,一个新闻网页与新闻领域相关。一首歌曲与音乐领域相关。而一个百科网页与百科领域相关等。本发明实施例可以针对搜索结果项记录对应的领域属性,以实现相应结果特征的提取。
通常的搜索结果项可以对应有页面,页面可以指用户触发搜索结果项后进入的页面,本发明实施例可以对搜索结果项对应的页面内容进行分析,以得到结果特征。
本发明实施例的结果特征可以作为搜索结果项与领域意图之间的匹配度的确定依据。可选地,可以将结果特征与领域对象的关键词进行匹配。
本发明实施例中,将结果特征与领域对象的关键词进行匹配的确定方式可以包括:字符串比较方式、或者词向量之间的相似度确定方式。
其中,字符串比较方式可以包括:对结果特征进行分词处理后,对结果特征包括的分词与领域对象的关键词进行字符串比较。
其中,词向量之间的相似度确定方式可以包括:对结果特征进行分词处理后,确定结果特征包括的各分词对应的词向量、以及领域对象的关键词对应的词向量,并利用相似度度量方法,确定结果特征包括的各分词对应的词向量与领域对象的关键词对应的词向量之间的相似度。
结果特征与领域对象的关键词之间的匹配度可以表征搜索结果项与领域意图之间的匹配度。而所述多个搜索结果项对应的排序位置可以在一定程度上反映搜索结果项对应的时效性、或者大多数用户的关注度,因此,本发明实施例可以依据多个搜索结果项对应的排序位置和每个搜索结果项对应的匹配度最高的第一领域意图,对至少两种领域意图进行排序,以从所述至少两种领域意图中确定出目标领域意图。
通常目标领域意图的数量为1,此种情况下,目标领域意图可以表征最优的领域意图。
根据一种实施例,可以依据排在第一位的搜索结果项对应的领域意图,得到目标领域意图。假设请求“七里香”对应的领域意图包括:百科意图1<七里香是一种内服的药疗药品>;百科意图2<七里香是一首来自歌手B的歌曲>;音乐意图1<播放七里香这首歌>等。假设搜索结果数据中排在第一位的搜索结果项与音乐意图之间的匹配度最高,则可以按照大多数用户对于领域意图的需求,确定目标领域意图为:音乐意图<播放七里香这首歌>,进而可以依据音乐意图<播放七里香这首歌>,确定对应的反馈结果。
根据另一种实施例,可以针对每个领域意图,确定其与排在前M位的M个搜索结果项之间的匹配次数,并依据该匹配次数,确定目标领域意图。例如,每个领域意图对应的匹配次数的初始值为0,若领域意图i与搜索结果项j匹配(也即两者的匹配度最高),则领域意图i对应的匹配次数加1。可选地,可以选取匹配次数最多的领域意图,作为目标领域意图。或者,可以选取匹配次数最多、且相匹配的任一搜索结果项排在前P位的领域意图,作为目标领域意图;其中,P为小于M的自然数,P通常为1、2、3等数值,本发明实施例还可以要求目标领域意图对应的任一搜索结果项排在前P位,以提高目标领域意图的时效性和用户关注度。
技术方案2
技术方案2中,上述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置;
则步骤203从所述至少两种领域意图中确定出目标领域意图,具体可以包括:针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别匹配度最高的第二领域意图;其中,所述结果项类别对应的排序位置可以由所述结果项类别包括的搜索结果项的排序位置确定;依据每个结果项类别对应的排序位置、结果项数量、以及第二领域意图,从所述至少两种领域意图中确定出目标领域意图。
技术方案2对多个搜索结果项进行聚类,得到的结果项类别中的多个搜索结果项可以具有共性。例如,人物B最近发生了事件B,则多个新闻网站可能均会报道人物B的事件B对应的新闻,本发明实施例可以通过聚类,将与“人物B的事件B”相关的多个新闻进行聚集。
通过技术方案2,可以依据具有共性的结果项类别对应的排序位置和结果项数量、以及每种结果项类别对应的第二领域意图,确定目标领域意图,以使目标领域意图的位置最优、且数量最多。其中,结果项类别对应的排序位置可以是:结果项类别所包括的搜索结果项的位置中、最靠前的位置,或者,排序位置可以是:结果项类别所包括的搜索结果项的平均位置。
例如,前P位搜索结果项均为:与“人物B的事件B”相关的新闻,则目标领域意图可以为新闻意图。第二领域意图的确定过程可以参照第一领域意图的确定过程,在此不作赘述。
技术方案3
技术方案3中,步骤203从所述至少两种领域意图中确定出目标领域意图,具体可以包括:将所述至少两种领域意图、以及所述请求对应的搜索结果数据输入第一模型,并依据所述第一模型输出的结果,确定所述请求对应的目标领域意图;其中所述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。
根据一种实施例,第一模型可以为排序模型。此种情况下,第一模型可以利用排序学习(Learning to Rank)方法,依据输入的搜索结果数据学习排序特征,并依据学习得到的排序特征、对至少两种领域意图进行排序。当然,第一模型也可以为分类模型,此种情况下,第一模型可以从至少两种领域意图中确定出请求对应的一种目标领域意图。
在实际应用中,第一模型可以直接输出目标领域意图,或者,第一模型可以输出请求到领域意图的概率,以根据该概率确定目标领域意图。
本发明实施例的第一模型可以对样本数据进行学习,样本数据可以包括:对应至少两种领域意图的搜索词、以及搜索词对应的搜索结果数据,通过对样本数据的学习,可以使得上述第一模型学习搜索结果数据对于对应至少两种领域意图的搜索词的影响,进而可以使得上述第一模型具备领域意图的排序能力。
可以理解,本领域技术人员可以根据实际应用需求,采用技术方案1至技术方案3中的任一或者组合,本发明实施例对于从所述至少两种领域意图中确定出目标领域意图的具体过程不加以限制。
步骤204中,假设本发明实施例应用于智能对话系统,则可以向智能对话系统的下游装置输出所述目标领域意图,以使该下游装置根据所述目标领域意图确定所述请求对应的反馈结果,由于该目标领域意图的时效性较强且更反映大多数用户的关注度,故可以提高反馈结果的准确度。
可选地,目标领域意图对应的目标领域可以提供反馈结果对应的数据源。例如,目标领域为新闻领域,则可以从新闻领域提供的与请求相关的数据中、抽取反馈结果。又如,目标领域为音乐领域,则反馈结果可以包括:请求所对应的目标歌曲的播放链接、或者介绍信息(如演唱者等)。
在智能对话场景中,可以向用户提供语音类型的反馈结果,以提升用户体验。当然,本发明实施例对于反馈结果的具体类型不加以限制,例如,反馈结果的类型还可以包括:文本、图片、音乐、或者视频等。
在本发明的一种可选实施例中,步骤203从所述至少两种领域意图中确定出目标领域意图,具体可以包括:依据所述请求对应的搜索结果数据、以及所述请求对应的上下文和/或用户属性和/或用户情绪,从所述至少两种领域意图中确定出目标领域意图。
其中,用户属性可以指用户具有的属性。将用户属性作为目标领域意图的确定依据,可以使得目标领域意图满足用户的个性化需求。
可选地,用户属性可以包括如下属性中的至少一种:场景属性、偏好属性和静态属性。
其中,场景属性可以包括用户所在的实时场景,如用户正在跑步、用户刚起床、用户在家、用户在单位等。或者,场景属性可以包括用户偏好的场景,如用户喜欢跑步等。
静态属性为相对稳定的属性,如用户的年龄、性别、地域、学历、商圈、职业、婚姻、消费等级、用户身份等。其中,用户身份可以指用户在社会行业中的身份,如医生、教师等用户职业。用户身份还可以指用户在家庭中的角色,如爸爸、妈妈、孩子等。
相对于上述静态属性的相对稳定性,场景属性和偏好属性通常具有动态性,其可以随着不断变化的用户行为而变化。
在本申请的一种可选实施例中,偏好属性可以指用户对内容的偏好属性。其中,该属性可以随着用户对于内容的行为(浏览行为、搜索行为、收藏行为、保存行为、关注行为、选择行为和评价行为中的至少一种)而变化。偏好属性的例子可以包括:喜欢游戏、喜欢音乐等。
在一种应用示例中,假设用户A和用户B的请求中均包括“七里香”,但用户A的用户身份为“医生”,则可以确定用户A的用户属性包括“医生”,假设“七里香”对应的多个搜索结果项中排在第一位的搜索结果项源自百科领域,因此可以确定用户A对应的目标领域意图包括:百科意图1<七里香是一种内服的药疗药品>。
假设用户B的偏好属性包括:“歌手B”,也即,用户B是“歌手B”的粉丝,假设设“七里香”对应音乐领域的搜索结果项排在前2位,因此可以确定用户B对应的目标领域意图包括:音乐意图1<播放七里香这首歌>。
在一种应用示例中,假设用户C、用户D、用户E的请求中均包括“苹果”,用户C的偏好属性包括“电子产品”,故可以确定用户C对应的目标领域意图包括:百科意图3<苹果的电子产品>;而用户D的用户身份为“孩子”,故可以确定用户D对应的目标领域意图包括:百科意图4<水果>;而用户E的用户身份包括“妈妈”、且用户E最近浏览过苹果的电子产品,则可以确定用户E对应的目标领域意图包括:电商意图4<苹果的购买链接>。
上下文可以指对话中与请求相邻的内容,如位于请求之前的上文、或者位于请求之后的下文等。上下文可以反映请求对应的语境,因此将上下文作为目标领域意图的确定依据,可以提高领域意图与用户的需求之间的匹配度。
例如,对话中位于请求“七里香”之前的上文为“我喜欢听”,则可以确定请求对应的目标领域意图包括:音乐意图1<播放七里香这首歌>。又如,对话中位于请求“七里香”之前的上文为“我最近发现了不错的药材”,则可以确定请求对应的目标领域意图包括:百科意图1<七里香是一种内服的药疗药品>。
本发明实施例中,情绪是指人有喜、怒、哀、乐、惧等心理体验,这种体验是人对客观事物的态度的一种反映。情绪具有肯定和否定的性质。能满足人的需要的事物会引起人的肯定性质的体验,如快乐、满意等;不能满足人需要的事物会引起人的否定性质的体验,如愤怒、憎恨、哀怨等;与需要无关的事物,会使人产生无所谓的情绪和情感。积极的情绪可以提高人的活动能力,而消极的情绪则会降低人的活动能力。部分老年人出现不良情绪的状况较多,长期情绪不好对身体健康不利,因此需要及时调节。
在本发明的一种可选实施例中,用户情绪可以包括:正面情绪、或者负面情绪,其中,正面情绪具有建设性和积极性,负面情绪具有破坏性和消极性。其中,负面情绪可以包括但不限于:焦虑、紧张、愤怒、沮丧、悲伤、痛苦等。正面情绪可以包括但不限于:开心、乐观、自信、欣赏、放松等。可选地,用户情绪还可以包括:中性情绪,中性情绪可以包括但不限于:平静、无所谓、冷淡、惊奇等。
本发明实施例依据用户的语音数据、和/或、图像数据,确定用户情绪。可选地,情绪检测方法可以包括:模式分类方法,该模式分类方法通过特征提取、模型训练和模型检测等环节,实现对于语音数据、和/或、图像数据的情绪检测。
通常用户对于内容的需求在不同的情绪下是有区别的,例如,用户在兴奋时喜欢快节奏的音乐,在失落时需要平淡的音乐。本发明实施例将用户情绪作为目标领域意图的确定依据,可以提升用户体验。
在本发明的一种可选实施例中,可以保存用户情绪与领域意图之间的映射关系,这样可以依据用户情绪,在该映射关系中进行查找,以实现依据用户情绪对领域意图进行筛选的作用。
可选地,可以对用户的历史内容进行分析,以得到用户情绪与领域意图之间的映射关系,这样可以使得用户情绪对应的领域意图符合用户的个性化习惯。例如,负面情绪对应的领域意图可以包括:电商领域,以使用户通过购物释放情绪;而正面情绪对应的领域意图可以包括:教育学习领域等,以使用户在心情舒畅的情况下学习、进而可以提高学习效率。
综上,本发明实施例的数据处理方法,依据请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;由于所述请求对应的搜索结果数据可以反映搜索环境中众多用户的搜索需求,因此,本发明实施例依据上述搜索结果数据得到的目标领域意图,可以反映搜索环境中大多数用户的搜索需求,因此可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
可选地,上述搜索结果数据可以获取时效性较强的信息,作为搜索结果项,和/或,上述搜索结果数据中多个搜索结果项的排序因子可以包括:时效性,因此,上述搜索结果数据可以反映不同的搜索结果项在时效性方面的差异,而搜索结果项可以与领域意图相应,因此,本发明实施例依据上述搜索结果数据得到的目标领域意图,可以具有较强的时效性;而大多数用户关注的是时效性较强的信息,因此,本发明实施例可以提高目标领域意图与用户的实际查询意图之间的匹配度,进而可以使请求对应的反馈结果更加符合用户的需求。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图3,示出了本发明的一种数据处理装置实施例的结构框图,具体可以包括:请求接收模块301、第一确定模块302、第二确定模块303和输出模块304。
其中,请求接收模块301,用于接收请求;
第一确定模块302,用于确定所述请求对应的至少两种领域意图;
第二确定模块303,用于依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;以及
输出模块304,用于输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
可选地,第二确定模块303可以包括:
提取模块,用于针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
第一领域意图确定模块,用于依据所述结果特征,确定所述多个搜索结果项对应的匹配度最高的第一领域意图;以及
第二领域意图确定模块,用于依据所述第一领域意图、以及所述多个搜索结果项对应的排序位置,从所述至少两种领域意图中确定出目标领域意图。
可选地,第二确定模块303可以包括:
提取模块,用于针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
聚类模块,用于依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;
第三确定模块,用于依据每个结果项类别可以包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别匹配度最高的第二领域意图;其中,所述结果项类别对应的排序位置由所述结果项类别可以包括的搜索结果项的排序位置确定;
第三领域意图确定模块,用于依据每个结果项类别对应的排序位置、结果项数量、以及第二领域意图,从所述至少两种领域意图中确定出目标领域意图。
可选地,所述提取模块可以包括:
信息提取模块,用于从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息可以包括如下信息中的至少一种:标题、摘要、领域属性和页面内容。
可选地,所述第二确定模块可以包括:
模型处理模块,用于将所述至少两种领域意图、以及所述请求对应的搜索结果数据输入第一模型,并依据所述第一模型输出的结果,确定所述请求对应的目标领域意图;其中所述搜索结果数据可以包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。
可选地,所述第二确定模块可以包括:
多维度确定模块,用于依据所述请求对应的搜索结果数据、以及所述请求对应的上下文和/或用户属性和/或用户情绪,从所述至少两种领域意图中确定出目标领域意图。
可选地,所述搜索结果数据获取时效性较强的信息,作为搜索结果项,和/或,所述搜索结果数据中多个搜索结果项的排序因子可以包括:时效性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收请求;确定所述请求对应的至少两种领域意图;依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
图4是根据一示例性实施例示出的一种用于数据处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音数据处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频数据处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2所示的数据处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:接收请求;确定所述请求对应的至少两种领域意图;依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
本发明实施例公开了A1、一种数据处理方法,所述方法包括:
接收请求;
确定所述请求对应的至少两种领域意图;
依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
A2、根据A1所述的方法,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
依据所述结果特征,确定每个搜索结果项对应的匹配度最高的第一领域意图;
依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项对应的第一领域意图,从所述至少两种领域意图中确定出目标领域意图。
A3、根据A1所述的方法,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;
依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别匹配度最高的第二领域意图;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;
依据每个结果项类别对应的排序位置、结果项数量、以及第二领域意图,从所述至少两种领域意图中确定出目标领域意图。
A4、根据A2或A3所述的方法,所述针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征,包括:
从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息包括如下信息中的至少一种:标题、摘要、领域属性和页面内容。
A5、根据A1所述的方法,所述从所述至少两种领域意图中确定出目标领域意图,包括:
将所述至少两种领域意图、以及所述请求对应的搜索结果数据输入第一模型,并依据所述第一模型输出的结果,确定所述请求对应的目标领域意图;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。
A6、根据A1所述的方法,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
依据所述请求对应的搜索结果数据、以及所述请求对应的上下文和/或用户属性和/或用户情绪,从所述至少两种领域意图中确定出目标领域意图。
A7、根据A1所述的方法,所述搜索结果数据获取时效性较强的信息,作为搜索结果项,和/或,所述搜索结果数据中多个搜索结果项的排序因子包括:时效性。
本发明实施例公开了B8、一种数据处理装置,包括:
请求接收模块,用于接收请求;
第一确定模块,用于确定所述请求对应的至少两种领域意图;
第二确定模块,用于依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;以及
输出模块,用于输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
B9、根据B8所述的装置,所述第二确定模块包括:
提取模块,用于针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
第一领域意图确定模块,用于依据所述结果特征,确定所述多个搜索结果项对应的匹配度最高的第一领域意图;以及
第二领域意图确定模块,用于依据所述第一领域意图、以及所述多个搜索结果项对应的排序位置,从所述至少两种领域意图中确定出目标领域意图。
B10、根据B8所述的装置,所述第二确定模块包括:
提取模块,用于针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
聚类模块,用于依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;
第三确定模块,用于依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别匹配度最高的第二领域意图;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;
第三领域意图确定模块,用于依据每个结果项类别对应的排序位置、结果项数量、以及第二领域意图,从所述至少两种领域意图中确定出目标领域意图。
B11、根据B9或10所述的装置,所述提取模块包括:
信息提取模块,用于从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息包括如下信息中的至少一种:标题、摘要、领域属性和页面内容。
B12、根据B8所述的装置,所述第二确定模块包括:
模型处理模块,用于将所述至少两种领域意图、以及所述请求对应的搜索结果数据输入第一模型,并依据所述第一模型输出的结果,确定所述请求对应的目标领域意图;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。
B13、根据B8所述的装置,所述第二确定模块包括:
多维度确定模块,用于依据所述请求对应的搜索结果数据、以及所述请求对应的上下文和/或用户属性和/或用户情绪,从所述至少两种领域意图中确定出目标领域意图。
B14、根据B8所述的装置,所述搜索结果数据获取时效性较强的信息,作为搜索结果项,和/或,所述搜索结果数据中多个搜索结果项的排序因子包括:时效性。
本发明实施例公开了C15、一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收请求;
确定所述请求对应的至少两种领域意图;
依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
C16、根据C15所述的装置,所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置;
所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
依据所述结果特征,确定所述多个搜索结果项对应的匹配度最高的第一领域意图;
依据所述第一领域意图、以及所述多个搜索结果项对应的排序位置,从所述至少两种领域意图中确定出目标领域意图。
C17、根据C15所述的装置,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;
依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别匹配度最高的第二领域意图;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;
依据每个结果项类别对应的排序位置、结果项数量、以及第二领域意图,从所述至少两种领域意图中确定出目标领域意图。
C18、根据C16或C17所述的装置,所述针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征,包括:
从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息包括如下信息中的至少一种:标题、摘要、领域属性和页面内容。
C19、根据C15所述的装置,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
将所述至少两种领域意图、以及所述请求对应的搜索结果数据输入第一模型,并依据所述第一模型输出的结果,确定所述请求对应的目标领域意图;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。
C20、根据C15所述的装置,所述从所述至少两种领域意图中确定出目标领域意图,包括:
依据所述请求对应的搜索结果数据、以及所述请求对应的上下文和/或用户属性和/或用户情绪,从所述至少两种领域意图中确定出目标领域意图。
C21、根据C15所述的装置,所述搜索结果数据获取时效性较强的信息,作为搜索结果项,和/或,所述搜索结果数据中多个搜索结果项的排序因子包括:时效性。
本发明实施例公开了22、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A7中一个或多个所述的数据处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种数据处理方法、一种数据处理装置和一种用于数据处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
接收请求;
确定所述请求对应的至少两种领域意图;
依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
2.根据权利要求1所述的方法,其特征在于,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
依据所述结果特征,确定每个搜索结果项对应的匹配度最高的第一领域意图;
依据所述多个搜索结果项、每个搜索结果项对应的排序位置、以及每个搜索结果项对应的第一领域意图,从所述至少两种领域意图中确定出目标领域意图。
3.根据权利要求1所述的方法,其特征在于,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征;
依据所述结果特征,对所述多个搜索结果项进行聚类,以得到对应的结果项类别;
依据每个结果项类别包括的搜索结果项,确定每个结果项类别对应的排序位置、结果项数量、以及与所述结果项类别匹配度最高的第二领域意图;其中,所述结果项类别对应的排序位置由所述结果项类别包括的搜索结果项的排序位置确定;
依据每个结果项类别对应的排序位置、结果项数量、以及第二领域意图,从所述至少两种领域意图中确定出目标领域意图。
4.根据权利要求2或3所述的方法,其特征在于,所述针对所述请求对应的多个搜索结果项,分别提取每个搜索结果项对应的结果特征,包括:
从一个搜索结果项对应的信息中,提取所述搜索结果项对应的结果特征;所述信息包括如下信息中的至少一种:标题、摘要、领域属性和页面内容。
5.根据权利要求1所述的方法,其特征在于,所述从所述至少两种领域意图中确定出目标领域意图,包括:
将所述至少两种领域意图、以及所述请求对应的搜索结果数据输入第一模型,并依据所述第一模型输出的结果,确定所述请求对应的目标领域意图;其中所述搜索结果数据包括:多个搜索结果项、以及每个搜索结果项对应的排序位置。
6.根据权利要求1所述的方法,其特征在于,所述依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图,包括:
依据所述请求对应的搜索结果数据、以及所述请求对应的上下文和/或用户属性和/或用户情绪,从所述至少两种领域意图中确定出目标领域意图。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述搜索结果数据获取时效性较强的信息,作为搜索结果项,和/或,所述搜索结果数据中多个搜索结果项的排序因子包括:时效性。
8.一种数据处理装置,其特征在于,包括:
请求接收模块,用于接收请求;
第一确定模块,用于确定所述请求对应的至少两种领域意图;
第二确定模块,用于依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;以及
输出模块,用于输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
9.一种用于数据处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收请求;
确定所述请求对应的至少两种领域意图;
依据所述请求对应的搜索结果数据,从所述至少两种领域意图中确定出目标领域意图;
输出所述目标领域意图,以根据所述目标领域意图确定所述请求对应的反馈结果。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811362486.8A CN109543016A (zh) | 2018-11-15 | 2018-11-15 | 一种数据处理方法、装置和用于数据处理的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811362486.8A CN109543016A (zh) | 2018-11-15 | 2018-11-15 | 一种数据处理方法、装置和用于数据处理的装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109543016A true CN109543016A (zh) | 2019-03-29 |
Family
ID=65847803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811362486.8A Pending CN109543016A (zh) | 2018-11-15 | 2018-11-15 | 一种数据处理方法、装置和用于数据处理的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543016A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909065A (zh) * | 2019-12-06 | 2020-03-24 | 光大兴陇信托有限责任公司 | 一种多数据源智能调用方法 |
CN112201250A (zh) * | 2020-09-30 | 2021-01-08 | 中移(杭州)信息技术有限公司 | 一种语义分析方法、装置、电子设备及存储介质 |
CN112489654A (zh) * | 2020-11-17 | 2021-03-12 | 深圳康佳电子科技有限公司 | 一种语音交互方法、装置、智能终端及存储介质 |
CN113486252A (zh) * | 2021-07-30 | 2021-10-08 | 北京字节跳动网络技术有限公司 | 搜索结果展示方法、装置、设备和介质 |
CN113763947A (zh) * | 2021-01-15 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种语音意图识别方法、装置、电子设备及存储介质 |
CN114146388A (zh) * | 2022-02-07 | 2022-03-08 | 北京新赛点体育投资股份有限公司 | 一种基于大数据的数据处理系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104838375A (zh) * | 2012-11-13 | 2015-08-12 | 微软技术许可有限责任公司 | 搜索结果基于意图的呈现 |
CN105893427A (zh) * | 2015-12-07 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 资源搜索方法以及服务器 |
CN105956137A (zh) * | 2011-11-15 | 2016-09-21 | 阿里巴巴集团控股有限公司 | 一种搜索方法、搜索装置及一种搜索引擎系统 |
CN106708887A (zh) * | 2015-11-17 | 2017-05-24 | 镇江诺尼基智能技术有限公司 | 一种意图驱动的产品搜索系统和方法 |
-
2018
- 2018-11-15 CN CN201811362486.8A patent/CN109543016A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956137A (zh) * | 2011-11-15 | 2016-09-21 | 阿里巴巴集团控股有限公司 | 一种搜索方法、搜索装置及一种搜索引擎系统 |
CN104838375A (zh) * | 2012-11-13 | 2015-08-12 | 微软技术许可有限责任公司 | 搜索结果基于意图的呈现 |
CN106708887A (zh) * | 2015-11-17 | 2017-05-24 | 镇江诺尼基智能技术有限公司 | 一种意图驱动的产品搜索系统和方法 |
CN105893427A (zh) * | 2015-12-07 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 资源搜索方法以及服务器 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909065A (zh) * | 2019-12-06 | 2020-03-24 | 光大兴陇信托有限责任公司 | 一种多数据源智能调用方法 |
CN110909065B (zh) * | 2019-12-06 | 2020-10-27 | 光大兴陇信托有限责任公司 | 一种多数据源智能调用方法 |
CN112201250A (zh) * | 2020-09-30 | 2021-01-08 | 中移(杭州)信息技术有限公司 | 一种语义分析方法、装置、电子设备及存储介质 |
CN112201250B (zh) * | 2020-09-30 | 2024-03-19 | 中移(杭州)信息技术有限公司 | 一种语义分析方法、装置、电子设备及存储介质 |
CN112489654A (zh) * | 2020-11-17 | 2021-03-12 | 深圳康佳电子科技有限公司 | 一种语音交互方法、装置、智能终端及存储介质 |
CN113763947A (zh) * | 2021-01-15 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种语音意图识别方法、装置、电子设备及存储介质 |
CN113763947B (zh) * | 2021-01-15 | 2024-04-05 | 北京沃东天骏信息技术有限公司 | 一种语音意图识别方法、装置、电子设备及存储介质 |
CN113486252A (zh) * | 2021-07-30 | 2021-10-08 | 北京字节跳动网络技术有限公司 | 搜索结果展示方法、装置、设备和介质 |
CN114146388A (zh) * | 2022-02-07 | 2022-03-08 | 北京新赛点体育投资股份有限公司 | 一种基于大数据的数据处理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543016A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
Shah et al. | Multimodal analysis of user-generated multimedia content | |
CN105895087B (zh) | 一种语音识别方法及装置 | |
Schedl et al. | Music recommender systems | |
Katarya et al. | Recent developments in affective recommender systems | |
Kofler et al. | User intent in multimedia search: a survey of the state of the art and future challenges | |
CN112131411A (zh) | 一种多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN109582869A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
EP3852044A1 (en) | Method and device for commenting on multimedia resource | |
CN111818370B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
Gulla et al. | Implicit user profiling in news recommender systems | |
CN110019777A (zh) | 一种信息分类的方法及设备 | |
Jia et al. | Multi-modal learning for video recommendation based on mobile application usage | |
Mukherjee et al. | Song recommendation using mood detection with Xception model | |
CN110222256A (zh) | 一种信息推荐方法、装置和用于信息推荐的装置 | |
CN115114395A (zh) | 内容检索及模型训练方法、装置、电子设备和存储介质 | |
CN114564666A (zh) | 百科信息展示方法、装置、设备和介质 | |
Yang | Research on music content recognition and recommendation technology based on deep learning | |
Saat et al. | Towards serendipity for content-based recommender systems | |
CN113573128A (zh) | 一种音频处理方法、装置、终端以及存储介质 | |
CN117011745A (zh) | 一种数据处理方法、装置、计算机设备以及可读存储介质 | |
Kathiravan et al. | Efficient Intensity Bedded Sonata Wiles System using IoT | |
CN114218930A (zh) | 一种标题生成方法、装置和用于标题生成的装置 | |
Park et al. | Image Is All for Music Retrieval: Interactive Music Retrieval System Using Images with Mood and Theme Attributes | |
Ghosh et al. | A comprehensive survey of personalized music identifier system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |