CN112182159A - 一种基于语义表示的个性化检索式对话方法和系统 - Google Patents
一种基于语义表示的个性化检索式对话方法和系统 Download PDFInfo
- Publication number
- CN112182159A CN112182159A CN202011055580.6A CN202011055580A CN112182159A CN 112182159 A CN112182159 A CN 112182159A CN 202011055580 A CN202011055580 A CN 202011055580A CN 112182159 A CN112182159 A CN 112182159A
- Authority
- CN
- China
- Prior art keywords
- sentence
- personalized
- matching
- candidate
- reply
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种基于语义表示的个性化检索式对话方法和系统,包括以下步骤:S1从用户发言历史语句集中抽取出个性化特征语句p;S2根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;S3将候选集C中的所有候选回复r={r1,r2,...,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);S4将候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。其针对社交媒体平台的开放域对话系统,个性化对话数据更易获得,数据可扩展性强。
Description
技术领域
本发明涉及一种基于语义表示的个性化检索式对话方法和系统,属于人工智能技术领域。
背景技术
个性化对话系统的实现主要可以分为两种形式,一种是为计算机直接设定键值对形式的个性化特征,即给定系统用户的具体年龄、性别、职业等信息。系统计算按照这种特征对应用户群体的说话风格给出回复。固定性格的个性化对话系统早期是通过机器学习和规则实现的,这种早期的个性化聊天机器人,使用定义输入输出模式、系统个性化与系统表现,决定针对某一输入的回复。而随着人工智能的发展,深度学习技术可用于个性化聊天系统的构建。然而,由于单一性格对话对话集的缺乏,使用深度学习技术解决固定性格的个性化聊天系统的工作较少。部分学者将个性定义为包含具体的年龄、性别、爱好等信息的键值对,引入个性检测器,基于序列到序列模型(SeqSeq)的解码器等,构建个性化聊天系统。
另一种个性化对话系统的实现方法是为计算机提供个性相关的描述性语句,或构建直接从用户的说话历史中提取个性化信息的个性化对话系统。在实现时,可以事先给定聊天者描述性的个性化特征语句,让聊天者按此性格进行对话,收集这些对话语句,构建出个性化对话对话集,进而构建出个性化聊天系统。也可以利用用户说话历史,抽取用户的个性化信息,将个性化特征语句与输入语句表示为向量,与回复语句进行语句匹配排序。
使用人工构建的个性化对话数据集进行研究的方法,存在个性化对话数据集规模较小,数据可扩展性差的缺陷。而使用用户历史提取个性化特征的方法,在用户特征语句数目较多、主题较为集中时,该模型的预测结果可能与特征语句的相关性强,而与用户输入语句相关性差,导致模型给出的回复并非输入语句的合理回复,造成模型返回的回复不佳,用户体验较差。
发明内容
针对上述问题,本发明的目的是提供一种基于语义表示的个性化检索式对话方法和系统。该系统是针对社交媒体平台的开放域对话系统,个性化对话数据更易获得,数据可扩展性强。
为实现上述目的,本发明采取以下技术方案:一种基于语义表示的个性化检索式对话方法,包括以下步骤:S1从用户发言历史语句集中抽取出个性化特征语句p;S2根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;S3将候选集C中的所有候选回复r={r1,r2,...,rn}分别与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);S4将候选回复集中的语句按匹配得分进行排序,选出得分最高的候选回复作为最终的个性化回复。
步骤S1中将满足以下特征的语句作为个性化特征语句p,其提取方法为:1)句子长度为5~30个字符;2)句中包含“我”;3)句中至少存在一个动词;4)句中存在名词,形容词或代词;5)句中包括用户历史语句中出现频次前20%的非停用词词语。
步骤S2中生成候选集C的方法为:S2.1记录输入语句q经过分词后的词语列表长度S2.2从个性化特征语句p中抽取出用户使用频率最高的个非停词词语,加入到待查询词语列表中,构成新的输入语句,记为q′;S2.3分别将新的输入语句q′与预建立的对话集中内容进行语句匹配,并计算语句匹配度;S2.4输出语句匹配度大于阈值的结果,所有结果构成候选集C。候选集C表示为:
C={r:match(p,q′)>阈值,}∪{r:match(r,q′)>阈值}
其中,{r:match(p,q′)>阈值}表示与“发布内容”的语句匹配结果,{r:match(r,q′)>阈值}表示与“评论内容”的语句匹配结果。
进一步,步骤S3中语句匹配包含个性化特征匹配和语义匹配两部分,将这两部分的语句匹配结果相加,经过soffmax函数,输出候选回复ri作为输入语句q合理的个性化回复的概率,最终得到语句匹配结果score(q,p,ri)。
进一步,步骤S3中每个候选回复ri的语句匹配得分score(q,p,ri)的计算公式为:
score(q,p,ri)=softmax(Matchs(q,ri)+Matchp(q,p,ri))
其中,Matchp表示候选回复ri与输入语句q,个性化特征语句p的语句匹配,Matchs表示不考虑个性化特征语句p的输入语句q与候选回复r的语义匹配。个性化特征语句匹配的方法为:首先将输入语句q、个性化特征语句p和候选回复语句ri分别输入LSTM模型中,获取句子语义表示,将输入语句q和个性化特征语句p的句子语义表示进行对位相加,将对位相加后的向量与候选回复语句ri进行点乘,得到个性化特征语句匹配度,其表示为:
进一步,语义匹配的方法为:将输入语句q和候选回复语句ri分别输入LSTM结构中,并将得到的语句表示与输入语句q进行点乘,获取输入语句q和候选回复语句ri间的语义匹配结果Matchs(q,ri)。
本发明公开了一种基于语义表示的个性化检索式对话系统,包括:特征提取模块,用于从用户发言历史语句集中抽取出个性化特征语句p;候选集模块,用于根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;语句匹配模块,用于将候选集C中的所有候选回复r={r1,r2,...,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);生成模块,用于将候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。
本发明由于采取以上技术方案,其具有以下优点:
1、本发明针对社交媒体平台的开放域对话系统,个性化对话数据更易获得,数据可扩展性强。
2、本发明从用户发言历史中抽取用户的个性化特征,在进行用户特征的个性化语句匹配的同时,加入仅考虑输入语句和回复语句相关性的语义匹配部分,确保模型给出的回复既能满足用户的个性化特征,又能作为输入语句的合理回复。
3、本发明利用用户的发言历史,构建用户的个性化特征,进行用户画像,基于规则,从用户的发言历史中抽取个性化特征。
附图说明
图1是本发明一实施例中基于语义表示的个性化检索式对话方法的示意图;
图2是本发明一实施例中语句匹配方法的示意图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
实施例一
本实施例公开了一种基于语义表示的个性化检索式对话方法,如图1所示,包括以下步骤:
S1从用户发言历史语句集中抽取出个性化特征语句p。
本实施例通过用户在社交平台上的发言历史提取用户的个性化特征。用户在社交平台上发布的所有语句构成该用户的发言历史,这些历史语句中蕴含着丰富的信息,有些语句可以反映该用户的性格、爱好等特征。本实施例对用户的历史发言语句进行筛选,将满足以下特征的语句作为个性化特征语句p:1)句子长度为5~30个字符;2)句中包含“我”;3)句中至少存在一个动词;4)句中存在名词,形容词或代词;5)句中包括用户历史语句中出现频次前20%的非停用词词语。其中,本实施例中依据哈工大停用词表进行停用词的判断。
S2根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C。
在本步骤中,系统根据用户的输入语句q和个性化特征语句p,从对话集中快速检索语句匹配,召回一批候选回复语句,构成候选集。本实施例借助Apache开源组织下Lucene开发的高性能搜索平台Solr,完成检索与召回的任务。待查询的对话集是由整体对话集抽取而来,整体对话集中的其他数据用于学习。
步骤S2中生成候选集C的方法为:
S2.3分别将新的输入语句q′与预建立的对话集中内容进行语句匹配,并计算语句匹配度;
S2.4输出语句匹配度大于阈值的结果,所有结果构成候选集C。
预建立的对话集中内容包括发布内容和评论内容,故候选集C表示为:
C={r:match(p,q′)>阈值,}∪{r:match(r,q′)>阈值}
其中,{r:match(p,q′)>阈值}表示与“发布内容”的语句匹配结果,{r:match(r,q′)>阈值}表示与“评论内容”的语句匹配结果。
为保证查询返回的候选回复数量较多、语句匹配度较高,本实施例经过多次测试,最终将语句匹配的精度设为40%。将发布内容和评论内容两部分筛选后的评论结合,按语句匹配分数选出语句匹配度最高的100条评论语句组成候选回复集C。
S3将候选集C中的所有候选回复r={r1,r2,...,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);
个性化检索式对话系统应满足两方面的需求:一是作为个性化对话系统,系统返回给用户的语句应当符合该用户的性格、爱好等特征,从而提升用户的体验;二是作为对话系统,系统给出的回复语句应当能够作为用户输入语句的合理回复。出于这两方面的考虑,本实施例分别在个性化特征层面与语义层面进行语句匹配。长短期记忆(LSTM)近年来发展迅猛,它能够有效捕获长序列信息,在处理序列相关的任务时有着卓越的表现。因此,本实施例采用长短期记忆(LSTM)输出语句的语义表示,构建语句匹配模型,以获取候选回复、用户输入语句和用户个性化特征语句的句子表示,从而进行语句匹配。
如图2所示,语句匹配包含个性化特征语句匹配和语义匹配两部分,将这两部分的语句匹配结果相加,经过softmax函数,输出候选回复ri作为输入语句q合理的个性化回复的概率,并生成语句匹配结果score(q,p,ri)。
每个候选回复ri的语句匹配得分score(q,p,ri)的计算公式为:
score(q,p,ri)=softmax(Matchs(q,ri)+Matchp(q,p,ri))
其中,Matchp表示候选回复ri与输入语句q,个性化特征语句p的语句匹配,Matchs表示不考虑个性化特征语句p的输入语句q与候选回复r的语义匹配。
个性化特征语句匹配的方法为:首先将输入语句q、个性化特征语句p和候选回复语句ri分别输入LSTM模型中,获取句子语义表示,同时考虑用户的当前输入和个性化特征,本实施例使用用户特征语句对当前输入语句进行扩充,即将输入语句q和个性化特征语句p的句子语义表示进行对位相加,将对位相加后的向量与候选回复语句ri进行点乘,得到个性化特征语句匹配度,其表示为:
若仅考虑个性化特征的语句匹配,可能导致系统轻视回复语句与输入语句匹配的合理性,从而造成系统给出的回复语句不是输入语句的合理回复。因此,本实施例又引入了语义匹配,考虑输入语句和候选回复间的语义关联性,针对输入语句与候选回复的语义匹配,确保系统给出回复的合理性。语义匹配的方法为:将输入语句q和候选回复语句ri分别输入LSTM结构中,并将得到的语句表示与输入语句q进行点乘,获取输入语句q和候选回复语句ri间的语义匹配结果Matchs(q,ri)。
其中,本实施例将LSTM隐藏层设为256,学习率设为le-4,batch_size设为16,使用Adam优化器进行优化LSTM模型,并使用Glove预训练300维词向量。
S4将候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复,其可以表示为:
r*=argmax score(q,p,r)。
实施例二
基于相同的发明构思,本实施例公开了一种基于语义表示的个性化检索式对话系统,包括:
特征提取模块,用于从用户发言历史语句集中抽取出个性化特征语句p;
候选集模块,用于根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;
语句匹配模块,用于将候选集C中的所有候选回复r={r1,r2,...,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);
重排序模块,用于将候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。上述内容仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于语义表示的个性化检索式对话方法,其特征在于,包括以下步骤:
S1从用户发言历史语句集中抽取出个性化特征语句p;
S2根据用户给出的输入语句q,结合所述个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;
S3将所述候选集C中的所有候选回复r={r1,r2,…,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);
S4将所述候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。
2.如权利要求1所述的基于语义表示的个性化检索式对话方法,其特征在于,所述步骤S3中所述语句匹配包含个性化特征语句匹配和语义匹配两部分,将这两部分的语句匹配结果相加,经过softmax函数,输出候选回复ri作为输入语句q合理的个性化回复的概率,并生成语句匹配结果score(q,p,ri)。
3.如权利要求2所述的基于语义表示的个性化检索式对话方法,其特征在于,所述步骤S3中每个候选回复ri的语句匹配得分score(q,p,ri)的计算公式为:
score(q,p,r)=softmax(Matchs(q,r)+Matchp(q,p,r))
其中,Matchp表示候选回复r与输入语句q,个性化特征语句p的语句匹配,Matchs表示不考虑个性化特征语句p的输入语句q与候选回复r的语义匹配。
5.如权利要求4所述的基于语义表示的个性化检索式对话方法,其特征在于,所述语义匹配的方法为:将输入语句q和候选回复语句ri分别输入LSTM结构中,并将得到的语句表示与输入语句q进行点乘,获取输入语句q和候选回复语句ri间的语义匹配结果Matchs(q,r)。
6.如权利要求4所述的基于语义表示的个性化检索式对话方法,其特征在于,所述LSTM模型通过Adam优化器进行优化。
7.如权利要求1-6任一项所述的基于语义表示的个性化检索式对话方法,其特征在于,所述步骤S1中将满足以下特征的语句作为个性化特征语句p提取方法为:1)句子长度为5~30个字符;2)句中包含“我”;3)句中至少存在一个动词;4)句中存在名词,形容词或代词;5)句中包括用户历史语句中出现频次前20%的非停用词词语。
9.如权利要求8所述的基于语义表示的个性化检索式对话方法,其特征在于,所述预建立的对话集中内容包括发布内容和评论内容,故所述候选集C表示为:
C={r:match(p,q′)>阈值,}∪{r:match(r,q′)>阈值}
其中,{r:match(p,q′)>阈值}表示与“发布内容”的语句匹配结果,{r:match(r,q′)>阈值}表示与“评论内容”的语句匹配结果,r为评论,p为与评论r对应的发布内容。
10.一种基于语义表示的个性化检索式对话系统,其特征在于,包括:
特征提取模块,用于从用户发言历史语句集中抽取出个性化特征语句p;
候选集模块,用于根据用户给出的输入语句q,结合所述个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;
语句匹配模块,用于将所述候选集C中的所有候选回复r={r1,r2,…,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);
重排序模块,用于将所述候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011055580.6A CN112182159B (zh) | 2020-09-30 | 2020-09-30 | 一种基于语义表示的个性化检索式对话方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011055580.6A CN112182159B (zh) | 2020-09-30 | 2020-09-30 | 一种基于语义表示的个性化检索式对话方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112182159A true CN112182159A (zh) | 2021-01-05 |
CN112182159B CN112182159B (zh) | 2023-07-07 |
Family
ID=73947110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011055580.6A Active CN112182159B (zh) | 2020-09-30 | 2020-09-30 | 一种基于语义表示的个性化检索式对话方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182159B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115481221A (zh) * | 2021-05-31 | 2022-12-16 | 腾讯科技(深圳)有限公司 | 对话数据的增强方法、装置、设备、计算机存储介质 |
CN115481221B (zh) * | 2021-05-31 | 2024-06-07 | 腾讯科技(深圳)有限公司 | 对话数据的增强方法、装置、设备、计算机存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294774A (zh) * | 2016-08-11 | 2017-01-04 | 北京光年无限科技有限公司 | 基于对话服务的用户个性化数据处理方法及装置 |
CN106844587A (zh) * | 2017-01-11 | 2017-06-13 | 北京光年无限科技有限公司 | 一种用于对话交互系统的数据处理方法及装置 |
US20190081914A1 (en) * | 2017-09-08 | 2019-03-14 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for generating candidate reply message |
CN110297887A (zh) * | 2019-06-26 | 2019-10-01 | 山东大学 | 基于云平台的服务机器人个性化对话系统及方法 |
CN110750616A (zh) * | 2019-10-16 | 2020-02-04 | 网易(杭州)网络有限公司 | 检索式聊天方法、装置以及计算机设备 |
CN111046132A (zh) * | 2019-10-25 | 2020-04-21 | 众安信息技术服务有限公司 | 一种检索多轮对话的客服问答处理方法及其系统 |
CN111159368A (zh) * | 2019-12-12 | 2020-05-15 | 华南理工大学 | 一种个性化对话的回复生成方法 |
-
2020
- 2020-09-30 CN CN202011055580.6A patent/CN112182159B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294774A (zh) * | 2016-08-11 | 2017-01-04 | 北京光年无限科技有限公司 | 基于对话服务的用户个性化数据处理方法及装置 |
CN106844587A (zh) * | 2017-01-11 | 2017-06-13 | 北京光年无限科技有限公司 | 一种用于对话交互系统的数据处理方法及装置 |
US20190081914A1 (en) * | 2017-09-08 | 2019-03-14 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for generating candidate reply message |
CN110297887A (zh) * | 2019-06-26 | 2019-10-01 | 山东大学 | 基于云平台的服务机器人个性化对话系统及方法 |
CN110750616A (zh) * | 2019-10-16 | 2020-02-04 | 网易(杭州)网络有限公司 | 检索式聊天方法、装置以及计算机设备 |
CN111046132A (zh) * | 2019-10-25 | 2020-04-21 | 众安信息技术服务有限公司 | 一种检索多轮对话的客服问答处理方法及其系统 |
CN111159368A (zh) * | 2019-12-12 | 2020-05-15 | 华南理工大学 | 一种个性化对话的回复生成方法 |
Non-Patent Citations (6)
Title |
---|
IULIAN SERBAN等: "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models", THIRTIETH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, vol. 30, no. 1, pages 3776 - 3783, XP055454537 * |
XIANGYANG ZHOU等: "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network", IN PROCEEDINGS OF THE 56TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, pages 1118 * |
XUELIANG ZHAO等: "A Document-grounded Matching Network for Response Selection in Retrieval-based Chatbots", 28TH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE, pages 1 - 7 * |
徐振: "聊天系统自动回复技术研究", 中国博士学位论文全文数据库 (信息科技辑), no. 1, pages 138 - 151 * |
毛存礼等: "融合语言模型和用户模型的个性化受限域问答检索方法研究", 第三十二届中国控制会议论文集, pages 663 - 666 * |
陈晨等: "基于深度学习的开放领域对话系统研究综述", 计算机学报, vol. 42, no. 7, pages 1439 - 1466 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115481221A (zh) * | 2021-05-31 | 2022-12-16 | 腾讯科技(深圳)有限公司 | 对话数据的增强方法、装置、设备、计算机存储介质 |
CN115481221B (zh) * | 2021-05-31 | 2024-06-07 | 腾讯科技(深圳)有限公司 | 对话数据的增强方法、装置、设备、计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112182159B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI732271B (zh) | 人機對話方法、裝置、電子設備及電腦可讀媒體 | |
CN107133213B (zh) | 一种基于算法的文本摘要自动提取方法与系统 | |
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
CN111259127B (zh) | 一种基于迁移学习句向量的长文本答案选择方法 | |
CN110096567B (zh) | 基于qa知识库推理的多轮对话回复选择方法、系统 | |
CN105095204B (zh) | 同义词的获取方法及装置 | |
CN107832306A (zh) | 一种基于Doc2vec的相似实体挖掘方法 | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN110879834B (zh) | 一种基于循环卷积网络的观点检索系统及其观点检索方法 | |
CN113761890B (zh) | 一种基于bert上下文感知的多层级语义信息检索方法 | |
Chien et al. | Topic-based hierarchical segmentation | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN113505209A (zh) | 一种面向汽车领域的智能问答系统 | |
CN113326374B (zh) | 基于特征增强的短文本情感分类方法及系统 | |
CN111400584A (zh) | 联想词的推荐方法、装置、计算机设备和存储介质 | |
CN114428850A (zh) | 一种文本检索匹配方法和系统 | |
CN112347339A (zh) | 一种搜索结果处理方法及装置 | |
CN110727769A (zh) | 语料库生成方法及装置、人机交互处理方法及装置 | |
CN111859950A (zh) | 一种自动化生成讲稿的方法 | |
CN112528653B (zh) | 短文本实体识别方法和系统 | |
CN112417170B (zh) | 面向不完备知识图谱的关系链接方法 | |
CN114417891B (zh) | 基于粗糙语义的回复语句确定方法、装置及电子设备 | |
CN116644148A (zh) | 关键词识别方法、装置、电子设备及存储介质 | |
CN113505196B (zh) | 基于词性的文本检索方法、装置、电子设备及存储介质 | |
CN113254586B (zh) | 一种基于深度学习的无监督文本检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |