CN111382245A - 一种基于自然语言处理技术的看房行程安排方法及装置 - Google Patents

一种基于自然语言处理技术的看房行程安排方法及装置 Download PDF

Info

Publication number
CN111382245A
CN111382245A CN201811636649.7A CN201811636649A CN111382245A CN 111382245 A CN111382245 A CN 111382245A CN 201811636649 A CN201811636649 A CN 201811636649A CN 111382245 A CN111382245 A CN 111382245A
Authority
CN
China
Prior art keywords
house
information
viewing
request information
watching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811636649.7A
Other languages
English (en)
Inventor
王文彬
尚尔昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN201811636649.7A priority Critical patent/CN111382245A/zh
Publication of CN111382245A publication Critical patent/CN111382245A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • G06Q10/025Coordination of plural reservations, e.g. plural trip segments, transportation combined with accommodation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于自然语言处理技术的看房行程安排方法及装置,该方法包括:接收用户终端输入的用自然语言描述的请求信息,并判断请求信息的类型;若获知为线下带看请求信息,则进行字段识别,并提取识别到的包括看房时间及见面地点的看房信息字段;根据看房时间匹配看房时间处于空闲状态的经纪人;根据看房时间、见面地点及经纪人的信息生成看房行程安排信息,并将看房行程安排信息反馈给用户终端。本发明实施例提供的基于自然语言处理技术的看房行程安排方法及装置,实现了自动化的线下看房行程安排,提高了经纪人和用户的沟通效率,减轻了经纪人作业压力,为用户提供了更好的找房体验。

Description

一种基于自然语言处理技术的看房行程安排方法及装置
技术领域
本发明实施例涉及自然语言处理技术领域,具体涉及一种基于自然语言处理技术的看房行程安排方法及装置。
背景技术
随着信息时代计算机技术的不断发展,人们对于信息的获取愈加便利,催生出大量线上找房的中介产品。这些应用的线上找房模式大同小异,用户可以在首页通过关键字搜索或者条件筛选,圈定一系列房源,然后点击进入每个房源的详情页,可以看到关于该房源的详细信息,比如价格、面积、朝向、小区等等。每个房源下有相应的经纪人联系方式,用户对于任何房源的疑问都可以向经纪人进行咨询,还可以向经纪人发起线下看房的请求,会有经纪人陪同看房。
现有的通过经纪人完成一次看房安排过程是存在一定弊端的,由于一名经纪人会负责多个用户的看房请求,所以一次看房安排需要经纪人和用户反复沟通才能确认看房时间、见面地点等细节,增加了沟通成本。
发明内容
为解决现有看房行程安排效率低下、人工依赖强的问题,本发明实施例提供一种基于自然语言处理技术的看房行程安排方法及装置。
第一方面,本发明实施例提供一种基于自然语言处理技术的看房行程安排方法,该方法包括:接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;当所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
可选地,所述看房信息字段及所述看房行程安排信息还包括联系人信息及联系方式信息;所述方法还包括将所述看房行程安排信息推送给经纪人终端。
可选地,所述判断所述请求信息的类型利用FastText模型进行,具体包括:对所述请求信息进行分词处理,得到与所述请求信息对应的n-gram向量,将所述n-gram向量作为FastText模型的输入,通过隐藏层的计算后,输出表示请求信息的类型的预设标签,根据所述预设标签得到所述请求信息的类型。
可选地,所述对所述线下带看请求信息进行字段识别,具体包括:利用BiLSTM-CRF模型对所述线下带看请求信息进行字段识别;其中,在所述BiLSTM-CRF模型的最后一层加了CRF,用于对输入的序列信息进行BIEO标注,从而识别所述看房信息字段。
可选地,所述将所述看房行程安排信息反馈给用户终端,具体包括:将所述看房行程安排信息以看房卡片的形式反馈给用户终端。
可选地,所述方法还包括:当所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息,并将所述响应消息反馈给所述用户终端。
可选地,当所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息;若所述响应消息的分值高于预设分数阈值,则将所述响应消息反馈给所述用户终端;若所述响应消息的分值不高于预设分数阈值,则将所述请求信息发送给经纪人终端,并将经纪人终端发送的回复信息反馈给所述用户终端。
第二方面,本发明实施例提供一种基于自然语言处理技术的看房行程安排装置,该装置包括:意图识别模块,用于接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;字段抽取模块,用于若判断获知所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;经纪人匹配模块,用于根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;看房行程安排信息输出模块,用于根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的基于自然语言处理技术的看房行程安排方法及装置,通过在获知接收的请求信息为线下带看请求信息后,进行字段识别、看房信息字段提取,并根据看房信息字段中的看房时间匹配经纪人,最终形成看房行程安排信息,实现了自动化的线下看房行程安排,提高了经纪人和用户的沟通效率,减轻了经纪人作业压力,为用户提供了更好的找房体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于自然语言处理技术的看房行程安排方法流程图;
图2是本发明实施例提供的基于自然语言处理技术的看房行程安排方法中的FastText模型的结构示意图;
图3是本发明实施例提供的基于自然语言处理技术的看房行程安排方法中BiLSTM-CRF模型的结构示意图;
图4是本发明实施例提供的基于自然语言处理技术的看房行程安排装置结构示意图;
图5是本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的基于自然语言处理技术的看房行程安排方法流程图。如图1所示,所述方法包括:
步骤101、接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;
基于自然语言处理技术的看房行程安排装置接收用户终端输入的用自然语言描述的请求信息,所述用自然语言描述的请求信息包括文本信息。
首先是对用户输入的请求信息进行意图识别,判断用户是否是想去看房。根据接收的所述请求信息,判断所述请求信息的类型。所述请求信息的类型可以根据请求的意图进行划分,比如包括闲聊型、房屋属性咨询、税费咨询等非看房请求信息以及线下带看请求信息。若所述请求信息为非看房请求信息,则表示用户没有看房需求;若所述请求信息为线下带看请求信息,则表示客户有看房需求。
在所述请求信息的类型的判断上,可以通过机器学习训练构建请求信息类型判断模型,用于进行请求信息的类型判断。构建请求信息类型判断模型时,通过大量的请求信息样本作为训练样本对模型进行训练。请求信息样本包括非看房请求信息及线下带看请求信息,训练时为每个训练样本设定好标签,比如输入为非看房请求信息(如闲聊型、房屋属性咨询、税费咨询等)时,输出为0;输入为看房请求信息时,输出为1。如此,通过大量样本不断训练,最终得到请求信息类型判断模型。
请求信息类型判断模型构建好后,便可根据接收的请求信息进行类型判断。请求信息的类型根据其输入模型后所输出的标签进行确定。比如,若模型输出1,则表示请求信息为线下带看请求信息;否则,为非看房请求信息。
步骤102、当所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;
若判断获知所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并从识别的字段中提取看房信息字段;所述看房信息字段是指反映看房信息的字段,所述看房信息字段包括看房时间及见面地点。
若判断获知所述请求信息为非看房请求信息,则不做上述字段识别以及提取识别到的看房信息字段的处理。
步骤103、根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;
根据所述看房时间匹配所述看房时间处于空闲状态的经纪人。根据用户看房时间要求,在经纪人管理系统中找到在对应时间空闲的经纪人。
步骤104、根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
根据所述看房时间、所述见面地点及所述匹配到的所述经纪人的信息生成看房行程安排信息,所述经纪人的信息包括经纪人的姓名及联系方式。生成所述看房行程安排信息后,将所述看房行程安排信息反馈给用户终端。
本发明实施例通过在获知接收的请求信息为线下带看请求信息后,进行字段识别、看房信息字段提取,并根据看房信息字段中的看房时间匹配经纪人,最终形成看房行程安排信息,实现了自动化的线下看房行程安排,提高了经纪人和用户的沟通效率,减轻了经纪人作业压力,为用户提供了更好的找房体验。
进一步地,基于上述实施例,所述看房信息字段及所述看房行程安排信息还包括联系人信息及联系方式信息;所述方法还包括将所述看房行程安排信息推送给经纪人终端。
所述看房信息字段还包括联系人信息及联系方式信息,所述联系人信息及联系方式信息包括用户的姓名及联系方式。相应地,所述看房行程安排信息还包括所述联系人信息及所述联系方式信息。
所述方法还包括将所述看房行程安排信息推送给经纪人终端,以供所匹配到的经纪人知晓所述看房行程安排信息,并及时通过所述联系人信息及联系方式信息与用户取得联系。
其中,将所述看房行程安排信息反馈给用户终端以及将所述看房行程安排信息推送给经纪人终端的动作的顺序可以进行设定,二者可以同时进行,也可以先后进行。
在上述实施例的基础上,本发明实施例通过在看房信息字段及看房行程安排信息包括联系人信息及联系方式信息,并将看房行程安排信息推送给经纪人终端,提高了看房行程安排的可靠性。
进一步地,基于上述实施例,利用FastText模型进行所述判断所述请求信息的类型,具体包括:对所述请求信息进行分词处理,得到与所述请求信息对应的n-gram向量,将所述n-gram向量作为FastText模型的输入,通过隐藏层的计算后,输出表示请求信息的类型的预设标签,根据所述预设标签得到所述请求信息的类型。
图2是本发明实施例提供的基于自然语言处理技术的看房行程安排方法中的FastText模型的结构示意图。如图2所示,w1、w2……wn-1、wn表示根据请求信息得到的n-gram向量,将n-gram向量作为FastText模型的输入,通过隐藏层的计算后,输出表示请求信息的类型的预设标签。所述预设标签在机器学习训练中设定。
FastText引入了sub word n-gram的概念来解决词形变化的问题,具有识别速度快,准确率高等优点,在文本识别特别是短文本处理上表现出色。举个例子,对于用户的一个请求信息,如“这个房子我能去看一下吗”,首先分词,得到“这个房子我能去看一下吗?”,为了表达一句话的前后界,加入<>两个字符,即变形为“<这个房子我能去看一下吗>”。假设希望抽取所有的tri-gram信息(即ngram中n=3),可以得到如下集合:G={<这个房子,这个房子我,我能去,去看一下,一下吗?,吗?>}。此处选择了n=3,将一句话表述成一个subword n-gram形式的集合。除了引入更多上下文信息,FastText直接将embedding(嵌入)过的向量特征求和取平均,而不再像CBOW模型那样将上下文词向量信息叠加起来再经过一次线性变换。
另外,FastText模型使用层次化Softmax大大降低了模型训练时间。层次化的Softmax的思想实质上是将一个全局多分类的问题,转化成为了若干个二元分类问题,从而将计算复杂度从O(V)降到O(logV)。每个二元分类问题,由一个基本的逻辑回归单元来实现。
最终,FastText模型会输出一个预设标签代表输入的请求信息的类别,比如1代表是“线下带看请求信息”,0代表是“非看房请求信息”。
在上述实施例的基础上,本发明实施例通过利用FastText模型获取请求信息的类型,提高了请求信息类型获取的准确度及效率,从而提高了基于自然语言处理技术的看房行程安排的准确度及效率。
进一步地,基于上述实施例,所述对所述线下带看请求信息进行字段识别,具体包括:利用BiLSTM-CRF模型对所述线下带看请求信息进行字段识别;其中,在所述BiLSTM-CRF模型的最后一层加了CRF,即条件随机场,用于对输入的序列信息进行BIEO标注,从而识别所述看房信息字段。
若所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段。其中,对所述线下带看请求信息进行字段识别,可通过BiLSTM-CRF模型实现。BiLSTM-CRF模型即带有条件随机场的双向LSTM模型。其中,LSTM(Long Short-Term Memory)表示长短期记忆网络。
图3是本发明实施例提供的基于自然语言处理技术的看房行程安排方法中BiLSTM-CRF模型的结构示意图。如图3所示,输入层输入的是根据请求信息对应的文本顺序得到的单个字,x1……x8表示词向量,
Figure BDA0001930203650000071
p1……p2分别表示前向LSTM、后向LSTM及隐藏层的神经单元。CRF层的O、DATE_B、DATE_I、DATE_E表示标注信息。
BiLSTM融合两组学习方向相反(一个按句子顺序,一个按句子逆序)的LSTM层,结构示意图如图3所示。LSTM设计的初衷是为了确保现实世界中信息的完整性,引入一个memory cell(记忆单元),即对历史信息进行记录,并且这个记录是有控制有选择的。由此引入了三个控制门的概念。这三个控制门分别控制LSTM单元应该写入什么、读取什么、输出什么。能够在理论上实现当前词即包含历史信息、又包含未来信息,更有利于对当前词进行标注。
通过LSTM网络的处理,相当于得到了一个比较好的对输入数据的表示方法,LSTM单元最终输出的向量即可以看成是输入数据的一种表示形式,最终在打标签阶段,由于字段识别需要识别出具体的信息,因此,采用将现有的线性统计模型与神经网络结构相结合,即LSTM与CRF相结合,得到最终的输出。
使用LSTM解决提取序列特征的问题,并通过隐藏层将序列信息输入到CRF层。在模型最后一层加了CRF,用于对输入的序列信息进行BIEO标注,从而识别所述看房信息字段。BIEO标注是标示用户的请求信息,使得计算机能够提取用户请求信息中的时间、地点、联系人及联系方式信息。将上述时间、地点、联系人及联系方式信息称为目标信息,由于目标信息通常是一个短语表达,所以用B标示信息开始,I标示信息中间,E标示信息结束,O标示非目标信息。对于不同种类的目标信息需要分别标注,如分别对时间信息及地点信息标注信息开始、信息中间及信息结束。
如图3所示,用户输入“我想明天下午看房”至BiLSTM-CRF模型,模型会识别出目标信息,也就是时间字段“明天下午”,其中“明”字是时间字段的开始,用DATE_B表示,“午”是时间字段的结束,用DATE_O表示,至于“天”和“下”位于时间字段的中间位置,用DATE_I表示。至于非目标信息如“我”、“想”、“看”、“房”,则都会识别为O。由此,经标注后,便可识别出看房信息字段中的看房时间,即明天下午。
在上述实施例的基础上,本发明实施例通过利用BiLSTM-CRF模型对线下带看请求信息进行字段识别,提高了字段识别的准确性,从而提高了基于自然语言处理技术的看房行程安排的可靠性。
进一步地,基于上述实施例,所述将所述看房行程安排信息反馈给用户终端,具体包括:将所述看房行程安排信息以看房卡片的形式反馈给用户终端。
在将所述看房行程安排信息反馈给用户终端时,以看房卡片的形式进行反馈。看房卡片中包括了上述看房时间、见面地点、带看经纪人的联系方式等信息。
将看房行程安排信息以看房卡片的形式反馈给用户终端,方便用户将看房行程添加至个人日程提醒中。
在上述实施例的基础上,本发明实施例通过将看房行程安排信息以看房卡片的形式反馈给用户终端,便利了对看房信息的收藏整理。
进一步地,基于上述实施例,所述方法还包括:若判断获知所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息,并将所述响应消息反馈给所述用户终端。
由于看房需求通常是在用户与经纪人的聊天过程中产生,在聊天过程中会产生多个所述请求信息,其中,有的请求信息可能为房屋属性咨询、税费咨询等非看房请求信息,有的请求信息则可能为线下带看请求信息。通常可能经过接收聊天过程中的多个其他类别的请求信息后,最后才能获取到线下带看请求信息。
为提高交互的效率,本发明实施例对接收的所述非看房请求信息根据预设的回答模板生成响应消息,并将所述响应消息反馈给所述用户终端,即用机器代替经纪人,实现机器与用户的“聊天”。
所述回答模板通过大量请求信息及回复所构成的样本训练而成,对于不同的非看房请求信息有不同的回答模板与之对应。
在上述实施例的基础上,本发明实施例通过对接收的所述请求信息根据预设的回答模板生成响应消息,并将所述响应消息反馈给所述用户终端,实现了自动化回复,提高了交互效率。
进一步地,基于上述实施例,所述方法还包括:若判断获知所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息;若所述响应消息的分值高于预设分数阈值,则将所述响应消息反馈给所述用户终端;否则,将所述请求信息发送给经纪人终端,并将经纪人终端发送的回复信息反馈给所述用户终端。
通常可能经过接收聊天过程中的多个其他类别的请求信息后,最后才能获取到线下带看请求信息。为提高回复的准确性,对于接收到的非看房请求信息,根据预设的回答模板生成所述非看房请求信息的响应消息;根据所述响应消息的置信区间,若获知所述响应消息的分值(即判定其回复准确性的分值)高于预设分数阈值,则直接将所述响应消息反馈给所述用户终端;否则,将所述请求信息发送给经纪人终端,并将经纪人终端发送的回复信息反馈给所述用户终端。
在上述实施例的基础上,本发明实施例通过在满足设定的要求时由机器回复用户请求信息,否则由经纪人进行回复,提高了回复的准确性,从而提高了获取到线下带看请求信息效率,提高了实用性。
图4是本发明实施例提供的基于自然语言处理技术的看房行程安排装置结构示意图。如图4所示,所述装置包括意图识别模块10、字段抽取模块20、经纪人匹配模块30及看房行程安排信息输出模块40,其中:
意图识别模块10用于接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;字段抽取模块20用于当所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;经纪人匹配模块30用于根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;看房行程安排信息输出模块40用于根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
本发明实施例通过在获知接收的请求信息为线下带看请求信息后,进行字段识别、看房信息字段提取,并根据看房信息字段中的看房时间匹配经纪人,最终形成看房行程安排信息,实现了自动化的线下看房行程安排,提高了经纪人和用户的沟通效率,减轻了经纪人作业压力,为用户提供了更好的找房体验。
进一步地,基于上述实施例,所述看房信息字段及所述看房行程安排信息还包括联系人信息及联系方式信息;所述看房行程安排信息输出模块40还用于将所述看房行程安排信息推送给经纪人终端。
在上述实施例的基础上,本发明实施例通过在看房信息字段及看房行程安排信息包括联系人信息及联系方式信息,并将看房行程安排信息推送给经纪人终端,提高了看房行程安排的可靠性。
进一步地,基于上述实施例,意图识别模块10利用FastText模型进行所述判断所述请求信息的类型;意图识别模块10在利用FastText模型进行所述判断所述请求信息的类型时,具体用于:对所述请求信息进行分词处理,得到与所述请求信息对应的n-gram向量,将所述n-gram向量作为FastText模型的输入,通过隐藏层的计算后,输出表示请求信息的类型的预设标签,根据所述预设标签得到所述请求信息的类型。
在上述实施例的基础上,本发明实施例通过利用FastText模型获取请求信息的类型,提高了请求信息类型获取的准确度及效率,从而提高了基于自然语言处理技术的看房行程安排的准确度及效率。
进一步地,基于上述实施例,字段抽取模块20利用BiLSTM-CRF模型对所述线下带看请求信息进行字段识别;其中,在所述BiLSTM-CRF模型的最后一层加了CRF,用于对输入的序列信息进行BIEO标注,从而识别所述看房信息字段。
在上述实施例的基础上,本发明实施例通过利用BiLSTM-CRF模型对线下带看请求信息进行字段识别,提高了字段识别的准确性,从而提高了基于自然语言处理技术的看房行程安排的可靠性。
进一步地,基于上述实施例,看房行程安排信息输出模块40在用于将所述看房行程安排信息反馈给用户终端时,具体用于:将所述看房行程安排信息以看房卡片的形式反馈给用户终端。
在上述实施例的基础上,本发明实施例通过将看房行程安排信息以看房卡片的形式反馈给用户终端,便利了对看房信息的收藏整理。
进一步地,基于上述实施例,所述装置还包括第一请求信息回复模块,具体用于:当所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息,并将所述响应消息反馈给所述用户终端。
在上述实施例的基础上,本发明实施例通过对接收的所述请求信息根据预设的回答模板生成响应消息,并将所述响应消息反馈给所述用户终端,实现了自动化回复,提高了交互效率。
进一步地,基于上述实施例,所述装置还包括第二请求信息回复模块,具体用于:当所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息;若所述响应消息的分值高于预设分数阈值,则将所述响应消息反馈给所述用户终端;否则,将所述请求信息发送给经纪人终端,并将经纪人终端发送的回复信息反馈给所述用户终端。
在上述实施例的基础上,本发明实施例通过在满足设定的要求时由机器回复用户请求信息,否则由经纪人进行回复,提高了回复的准确性,从而提高了获取到线下带看请求信息效率,提高了实用性。
本发明实施例提供的装置是用于上述方法的,具体功能可参照上述方法流程,此处不再赘述。
图5是本发明实施例提供的电子设备的实体结构示意图。如图5所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如下方法:接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;当所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于自然语言处理技术的看房行程安排方法,其特征在于,包括:
接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;
当所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;
根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;
根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
2.根据权利要求1所述的方法,其特征在于,所述看房信息字段及所述看房行程安排信息还包括联系人信息及联系方式信息;
所述方法还包括将所述看房行程安排信息推送给经纪人终端。
3.根据权利要求1所述的方法,其特征在于,所述判断所述请求信息的类型利用FastText模型进行,具体包括:对所述请求信息进行分词处理,得到与所述请求信息对应的n-gram向量,将所述n-gram向量作为FastText模型的输入,通过隐藏层的计算后,输出表示请求信息的类型的预设标签,根据所述预设标签得到所述请求信息的类型。
4.根据权利要求1所述的方法,其特征在于,所述对所述线下带看请求信息进行字段识别,具体包括:
利用BiLSTM-CRF模型对所述线下带看请求信息进行字段识别;
其中,在所述BiLSTM-CRF模型的最后一层加了CRF,用于对输入的序列信息进行BIEO标注,从而识别所述看房信息字段。
5.根据权利要求1所述的方法,其特征在于,所述将所述看房行程安排信息反馈给用户终端,具体包括:
将所述看房行程安排信息以看房卡片的形式反馈给用户终端。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息,并将所述响应消息反馈给所述用户终端。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述请求信息为非看房请求信息,则根据预设的回答模板生成所述非看房请求信息的响应消息;若所述响应消息的分值高于预设分数阈值,则将所述响应消息反馈给所述用户终端;若所述响应消息的分值不高于预设分数阈值,则将所述请求信息发送给经纪人终端,并将经纪人终端发送的回复信息反馈给所述用户终端。
8.一种基于自然语言处理技术的看房行程安排装置,其特征在于,包括:
意图识别模块,用于接收用户终端输入的用自然语言描述的请求信息,并判断所述请求信息的类型;
字段抽取模块,用于当所述请求信息为线下带看请求信息,则对所述线下带看请求信息进行字段识别,并提取识别到的看房信息字段,所述看房信息字段包括看房时间及见面地点;
经纪人匹配模块,用于根据所述看房时间匹配所述看房时间处于空闲状态的经纪人;
看房行程安排信息输出模块,用于根据所述看房时间、所述见面地点及所述经纪人的信息生成看房行程安排信息,并将所述看房行程安排信息反馈给所述用户终端。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN201811636649.7A 2018-12-29 2018-12-29 一种基于自然语言处理技术的看房行程安排方法及装置 Pending CN111382245A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811636649.7A CN111382245A (zh) 2018-12-29 2018-12-29 一种基于自然语言处理技术的看房行程安排方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811636649.7A CN111382245A (zh) 2018-12-29 2018-12-29 一种基于自然语言处理技术的看房行程安排方法及装置

Publications (1)

Publication Number Publication Date
CN111382245A true CN111382245A (zh) 2020-07-07

Family

ID=71216435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811636649.7A Pending CN111382245A (zh) 2018-12-29 2018-12-29 一种基于自然语言处理技术的看房行程安排方法及装置

Country Status (1)

Country Link
CN (1) CN111382245A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108200189A (zh) * 2018-01-18 2018-06-22 吴静 一种基于虚拟现实的智能房屋租赁系统
CN108364241A (zh) * 2018-01-10 2018-08-03 链家网(北京)科技有限公司 一种提高房源带看量的方法及装置
CN108536680A (zh) * 2018-04-12 2018-09-14 北京焦点新干线信息技术有限公司 一种房产信息的获取方法和装置
CN108564277A (zh) * 2018-04-11 2018-09-21 平安好房(上海)电子商务有限公司 看房业务处理方法、装置、设备及可读存储介质
CN108763510A (zh) * 2018-05-30 2018-11-06 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364241A (zh) * 2018-01-10 2018-08-03 链家网(北京)科技有限公司 一种提高房源带看量的方法及装置
CN108200189A (zh) * 2018-01-18 2018-06-22 吴静 一种基于虚拟现实的智能房屋租赁系统
CN108564277A (zh) * 2018-04-11 2018-09-21 平安好房(上海)电子商务有限公司 看房业务处理方法、装置、设备及可读存储介质
CN108536680A (zh) * 2018-04-12 2018-09-14 北京焦点新干线信息技术有限公司 一种房产信息的获取方法和装置
CN108763510A (zh) * 2018-05-30 2018-11-06 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
余鹏: "基于信息抽取技术的房屋租赁信息平台的设计与实现", 《万方学术期刊数据库》 *

Similar Documents

Publication Publication Date Title
CN108874776B (zh) 一种垃圾文本的识别方法及装置
US9740677B2 (en) Methods and systems for analyzing communication situation based on dialogue act information
Saha et al. BERT-caps: A transformer-based capsule network for tweet act classification
CN110263160B (zh) 一种计算机问答系统中的问句分类方法
US11429834B1 (en) Neural-based agent assistance interface for providing answers based on a query vector
JP6677419B2 (ja) 音声対話方法及び装置
Shilpa et al. Sentiment analysis using deep learning
US11783179B2 (en) System and method for domain- and language-independent definition extraction using deep neural networks
US20180226073A1 (en) Context-based cognitive speech to text engine
CN111125354A (zh) 文本分类方法及装置
Windiatmoko et al. Developing facebook chatbot based on deep learning using rasa framework for university enquiries
CN114239547A (zh) 一种语句生成方法及电子设备、存储介质
CN112347787A (zh) 方面级别情感分类方法、装置、设备及可读存储介质
CN112926308B (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
CN111639162A (zh) 信息交互方法和装置、电子设备和存储介质
CN112632244A (zh) 一种人机通话的优化方法、装置、计算机设备及存储介质
Windiatmoko et al. Developing FB chatbot based on deep learning using RASA framework for university enquiries
CN112256863A (zh) 一种确定语料意图的方法、装置及电子设备
CN114218945A (zh) 实体识别方法、装置、服务器及存储介质
CN116975292A (zh) 信息识别方法、装置、电子设备、存储介质及程序产品
TWI734085B (zh) 使用意圖偵測集成學習之對話系統及其方法
CN112036186A (zh) 语料标注方法、装置、计算机存储介质及电子设备
CN116541517A (zh) 文本信息处理方法、装置、设备、软件程序以及存储介质
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN113869068A (zh) 场景服务推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200707