CN117369653A - 输入文本推荐方法、装置、存储介质及计算机设备 - Google Patents

输入文本推荐方法、装置、存储介质及计算机设备 Download PDF

Info

Publication number
CN117369653A
CN117369653A CN202311427287.1A CN202311427287A CN117369653A CN 117369653 A CN117369653 A CN 117369653A CN 202311427287 A CN202311427287 A CN 202311427287A CN 117369653 A CN117369653 A CN 117369653A
Authority
CN
China
Prior art keywords
text
input
candidate
sentence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311427287.1A
Other languages
English (en)
Inventor
冯雷
邵亚飞
胡妙丽
鲁剑
辜海玻
刘家琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202311427287.1A priority Critical patent/CN117369653A/zh
Publication of CN117369653A publication Critical patent/CN117369653A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs

Abstract

本公开提供了一种输入文本推荐方法、装置、存储介质及计算机设备。方法通过根据输入法客户端接收到的输入信息确定目标候选词;基于目标候选词在预设句库中确定至少一个第一候选句文本;获取输入法客户端的输入环境信息以及历史上屏文本,历史上屏文本为输入法客户端展示的候选文本中被选中并上屏显示的词或句;将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本;在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。该方法可以提升文本输入效率。

Description

输入文本推荐方法、装置、存储介质及计算机设备
技术领域
本公开涉及输入法技术领域,特别是涉及一种输入文本推荐方法、装置、存储介质及计算机设备。
背景技术
输入法是指为将各种符号输入电子信息设备(例如计算机设备、手机等)而采用的编码方法。近年来,输入法技术发展迅速,输入法应用可以根据对象输入的少量的字符串精准地预测到对象期待输入的词语,并将预测到的词语推荐给对象进行选择输入,这极大地提升了文本输入的效率。
然而,目前的输入法应用单次能够输入的内容较少,当对象需要进行较大篇幅的文本输入时,输入效率较低。
发明内容
本公开实施例提供了一种输入文本推荐方法、装置、存储介质及计算机设备,该方法可以提升文本输入的效率。
根据本公开的一方面,提供了一种输入文本推荐方法,包括:
根据输入法客户端接收到的输入信息确定目标候选词;
基于所述目标候选词在预设句库中确定至少一个第一候选句文本;
获取所述输入法客户端的输入环境信息以及历史上屏文本,所述历史上屏文本为所述输入法客户端展示的候选文本中被选中并上屏显示的词或句;
将所述目标候选词、所述输入环境信息以及所述历史上屏文本发送给大语言模型进行内容生成,并接收所述大语言模型返回的第二候选句文本;
在所述至少一个第一候选句文本与所述第二候选句文本中确定目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示。
根据本公开的一方面,提供了一种输入文本推荐装置,包括:
第一确定单元,用于根据输入法客户端接收到的输入信息确定目标候选词;
第二确定单元,用于基于所述目标候选词在预设句库中确定至少一个第一候选句文本;
获取单元,用于获取所述输入法客户端的输入环境信息以及历史上屏文本,所述历史上屏文本为所述输入法客户端展示的候选文本中被选中并上屏显示的词或句;
发送单元,用于将所述目标候选词、所述输入环境信息以及所述历史上屏文本发送给大语言模型进行内容生成,并接收所述大语言模型返回的第二候选句文本;
第三确定单元,用于在所述至少一个第一候选句文本与所述第二候选句文本中确定目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示。
可选地,在一些实施例中,所述发送单元,包括:
发送子单元,用于将所述目标候选词、所述输入环境信息以及所述历史上屏文本分多个轮次发送给大语言模型进行多轮内容生成;
第一确定子单元,用于根据所述大语言模型最后一轮输出的生成内容确定第二候选句文本。
可选地,在一些实施例中,所述发送子单元,包括:
第一发送模块,用于将所述目标候选词与所述输入环境信息发送给大语言模型进行内容生成,并接收所述大语言模型输出的第一中间生成内容;
第二发送模块,用于将所述历史上屏文本发送给所述大语言模型进行内容生成,并接收所述大语言模型输出的第二中间生成内容;
获取模块,用于获取所述目标候选词的领域信息对应的领域词,并将所述领域词发送给所述大语言模型进行内容生成;
所述第一确定子单元,还用于:
根据第三轮内容生成得到的生成内容确定第二候选句文本。
可选地,在一些实施例中,所述第一发送模块,包括:
确定子模块,用于根据所述输入环境信息确定生成内容的篇幅信息和表达方式信息;
第一发送子模块,用于将所述目标候选词、所述篇幅信息以及所述表达方式信息发送给大语言模型进行内容生成,并接收所述大语言模型输出的第一中间生成内容。
可选地,在一些实施例中,所述获取模块,包括:
第二发送子模块,用于将所述目标候选词发送给目标服务器进行领域词分析;
接收子模块,用于接收所述目标服务器返回的领域词。
可选地,本公开提供的输入文本推荐装置,还包括:
第一获取子单元,用于获取所述目标候选句文本中被选择上屏的目标句文本;
更新子单元,用于根据所述目标句文本更新所述预设句库。
可选地,在一些实施例中,所述更新子单元,包括:
建立模块,用于建立所述目标候选词与所述目标句文本之间的映射关系;
更新模块,用于基于所述映射关系对所述预设句库中所述目标候选词对应的句文本进行更新。
可选地,在一些实施例中,所述第三确定单元,包括:
第二获取子单元,用于获取每一第一候选句文本的历史上屏信息;
排序子单元,用于根据所述历史上屏信息对所述至少一个第一候选句文本进行重要性排序;
第二确定子单元,用于将重要性排序在前的预设数量个第一候选句文本与所述第二候选句文本确定为目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示。
可选地,在一些实施例中,所述历史上屏信息包括历史上屏时间信息以及历史上屏次数信息,所述排序子单元,包括:
第一确定模块,用于根据所述历史上屏时间确定每一第一候选句文本的第一重要性权重系数;
第二确定模块,用于根据所述历史上屏次数信息确定每一第一候选句文本的第二重要性权重系数;
排序模块,用于基于所述第一重要性权重系数和所述第二重要性权重系数对所述至少一个第一候选句文本进行重要性排序。
可选地,在一些实施例中,所述第二确定子单元,包括:
去重模块,用于将重要性排序在前的预设数量个第一候选句文本与所述第二候选句文本组成的句文本集合进行去重;
第三确定模块,用于根据去重后得到的多个候选句文本确定目标候选句文本。
可选地,本公开中目标候选文本的推荐显示具体可以由推荐显示单元实现,所述推荐显示单元,包括:
第一显示子单元,用于显示所述输入法客户端的文本输入界面,所述文本输入界面包括输入字符串显示区和推荐文本显示区;
第二显示子单元,用于在所述推荐文本显示区显示所述目标候选句文本。
可选地,所述推荐显示单元,还包括:
第三显示子单元,用于响应于接收到的字符串输入操作,在所述输入字符串显示区显示输入的目标字符串,在所述推荐文本显示区显示多个推荐候选词;
第三确定子单元,用于响应于接收到的候选词选取操作,基于所述候选词选取操作在所述多个推荐候选词中确定目标候选词;
第四确定子单元,用于响应于接收到的推荐候选内容切换指令,基于所述目标候选词确定目标候选句文本。
可选地,在一些实施例中,所述推荐显示单元,还包括:
第四显示子单元,用于响应于对所述推荐文本显示区显示的文本的选择上屏操作,将被选中的文本在目标应用的文本显示区域进行上屏显示,所述选中的文本为候选词或候选句;
第五显示子单元,用于在所述输入法客户端的文本输入界面显示至少一个候选推荐文本,所述候选推荐文本为根据所述目标应用的上下文信息、所述选中的文本以及所述目标应用的应用程序信息生成的句文本。
可选地,在一些实施例中,所述第一确定单元,包括:
第三获取子单元,用于获取所述目标候选词对应的索引信息;
查找子单元,用于基于所述索引信息在所述预设句库中进行查找,得到至少一个第一候选句文本。
根据本公开的一方面,提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的输入文本推荐方法。
根据本公开的一方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,所述计算机程序被计算机设备的处理器读取并执行,使得该计算机设备执行如上所述的输入文本推荐方法。
本公开实施例中,通过根据输入法客户端接收到的输入信息确定目标候选词;基于目标候选词在预设句库中确定至少一个第一候选句文本;获取输入法客户端的输入环境信息以及历史上屏文本,历史上屏文本为输入法客户端展示的候选文本中被选中并上屏显示的词或句;将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本;在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。以此,采用本公开提供的输入文本推荐方法,可以根据输入法客户端接收到的输入信息、输入环境信息以及输入法客户端的历史上屏文本来确定候选句文本,并将确定的候选句文本直接在输入法客户端的输入推荐界面进行推荐显示。如此,输入法客户端的使用对象可以直接进行整句的选择输入,从而可以大大提升文本输入的效率。
本公开的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本公开技术方案的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开的技术方案,并不构成对本公开技术方案的限制。
图1是根据本公开的实施例的输入文本推荐方法应用的系统构架图;
图2a至2c是输入文本推荐方法应用在即时通讯软件中的聊天场景下的示意图;
图3a至3b是输入文本推荐方法应用在文档应用的文本编辑场景下的示意图;
图4是本公开提供的输入文本推荐方法的一个流程示意图;
图5a是相关技术中在输入法应用中集成大语言模型的示意图;
图5b是相关技术中内容生成应用的界面示意图;
图6是本公开中提供的输入法客户端的显示界面示意图;
图7是本公开提供的输入法客户端的显示界面的另一示意图;
图8是本公开提供的输入法客户端的显示界面的又一示意图;
图9是本公开提供的输入文本推荐方法的另一流程示意图;
图10是本公开实施例的输入文本推荐装置的结构示意图;
图11是实施根据本公开的一个实施例的各方法的终端结构图;
图12是实施根据本公开的一个实施例的各方法的服务器结构图。
具体实施方式
为了使本公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本公开,并不用于限定本公开。
对本公开实施例进行进一步详细说明之前,对本公开实施例中涉及的名词和术语进行说明,本公开实施例中涉及的名词和术语适用于如下的解释:
输入法:指为将各种符号输入电子信息设备而采用的编码方法。在本文中,输入法具体指输入法应用或输入法系统,输入法系统具体包括装载输入法客户端的终端与输入法内核(或称为输入法应用服务器)。
大语言模型(large language model,LLM):指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。常见大语言模型例如有ChatGPT,ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
预训练模型(Pre-training model),也称基石模型、大模型,指具有大参量的深度神经网络(Deep neural network,DNN),在海量未标记的数据上对其进行训练,利用大参量DNN的函数近似能力使PTM在数据上提取共性特征,经微调(fine tune)、参数高效微调(PEFT)、prompt-tuning等技术,适用于下游任务。因此,预训练模型可以在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想效果。PTM按照处理的数据模态可以分为语言模型(ELMO,BERT,GPT)、视觉模型(swin-transformer,ViT,V-MOE)、语音模型(VALL-E)、多模态模型(ViBERT,CLIP,Flamingo,Gato)等,其中多模态模型指建立两种或以上数据模态特征表示的模型。预训练模型是输出人工智能生成内容(AIGC)重要工具,也可以作为连接多个具体任务模型的通用接口。
上屏:将输入法应用的候选界面中的候选文本选中并显示在具体应用的文本显示区域的过程,例如在即时通讯应用中采用输入法进行文本输入时,对象采用输入法进行文本输入,当对象输入字符串后,输入法应用的候选界面会显示推荐的候选文本,当对象在多个推荐的候选文本中选中一个后,将选中的候选文本在即时通讯应用的文本显示界面进行显示的过程,便为文本上屏。
随着计算机技术的不断发展,各类计算机应用开始涌现,这些具有不同功能的计算机应用,极大地丰富了人们的生活,也提升了人们生产工作的效率。每个计算机应用,都需要与使用对象进行交互以实现其功能,目前使用对象与应用之间最常用的交互方式便是通过输入法进行文本输入的交互。因此,输入法的文本输入效率便在很大程度上影响到应用程序的使用效率。近年来,输入法应用的研发人员通过提升对使用对象的使用习惯识别的准确性、优化推荐词库中的候选词等方式来不断提升对象输入预测的准确性,达到能够根据对象的输入字符进行准确的候选词推荐的目的,进而提升对象文本输入的效率。然而,目前的优化仍局限于词级别的推荐优化,这对输入效率的提升有限。对此,本公开提供一种基于句库和大语言模型进行句文本推荐的方法,以期能够在较大程度上提升文本输入的效率。
本公开实施例应用的系统体系构架及场景说明
图1是根据本公开的实施例的输入文本推荐方法所应用的系统构架图。它包括终端140、互联网130、网关120、服务器110等。
终端140括桌面电脑、膝上型电脑、PDA(个人数字助理)、手机、车载终端、家庭影院终端、专用终端等多种形式。另外,它可以是单台设备,也可以是多台设备组成的集合。终端140可以以有线或无线的方式与互联网130进行通信,交换数据。
服务器110是指能对终端140提供某些服务的计算机系统。相对于普通终端140来说,服务器110在稳定性、安全性、性能等方面都要求更高。服务器110可以是网络平台中的一台高性能计算机、多台高性能计算机的集群、一台高性能计算机中划出的一部分(例如虚拟机)、多台高性能计算机中划出的一部分(例如虚拟机)的组合等。
网关120又称网间连接器、协议转换器。网关在传输层上实现网络互连,是一种充当转换作用的计算机系统或设备。在使用不同的通信协议、数据格式或语言,甚至体系结构完全不同的两种系统之间,网关是一个翻译器。同时,网关也可以提供过滤和安全功能。终端140向服务器110发送的消息要通过网关120发送到相应的服务器110。服务器110向终端140发送的消息也要通过网关120发送到相应的终端140。
本公开实施例的输入文本推荐方法具体可以在服务器110中实现;具体地,服务器110可以根据终端140中装载的输入法客户端接收到的输入信息确定目标候选词;基于目标候选词在预设句库中确定至少一个第一候选句文本;获取输入法客户端的输入环境信息以及历史上屏文本,历史上屏文本为输入法客户端展示的候选文本中被选中并上屏显示的词或句;将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本;在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给终端140中装载的输入法客户端进行推荐显示。
本公开实施例的输入文本推荐方法具体也可以在终端140中实现;具体地,终端140可以根据其上装载的输入法客户端接收到的输入信息确定目标候选词;基于目标候选词在预设句库中确定至少一个第一候选句文本;获取输入法客户端的输入环境信息以及历史上屏文本,历史上屏文本为输入法客户端展示的候选文本中被选中并上屏显示的词或句;将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本;在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给终端140中装载的输入法客户端进行推荐显示。
本公开实施例可以应用在基于输入法进行文本输入的场景中,具体例如应用在使用输入法在即时通讯软件中进行聊天的场景或者使用输入法在文档应用中进行文本编辑的场景中。
如图2a至2c所示,为本公开实施例应用在即时通讯软件中的聊天场景下的示意图。在该场景下,输入法应用在接收到对象输入的“afgy”字符串后,可以在输入法应用的候选推荐页面上显示推荐的候选词“按份共有”以及根据推荐的候选词“按份共有”确定的推荐的候选句,如图2a所示,此处显示一个推荐的候选句只是一个示例,实际可以显示多个推荐的候选句。对象可以在多个推荐的候选句中选择目标候选句以将目标候选句上屏显示在即时通讯软件的对话内容编辑区域中,如图2b所示。对象可以进一步将目标候选句发送给聊天的对象,即将目标候选句显示在对话框中,如图2c所示。此举可以大大提升采用即时通讯软件进行聊天时的文本输入效率。
如图3a至3b所示,为本公开实施例应用在文档应用的文本编辑场景下的示意图。在该场景下,输入法应用在接收到对象输入的“afgy”字符串后,可以在输入法应用的候选推荐页面上显示推荐的候选词“按份共有”以及推荐的候选句,如图3a所示。此处显示一个推荐的候选句同样只是一个示例,实际可以显示多个推荐的候选句。对象可以在多个推荐的候选句中选择目标候选句,如此便可以将选中的目标候选句显示在文档应用的文档编辑页面中,如图3b所示。如此可以大大提升文档编辑的效率。
本公开实施例的总体说明
根据本公开的一个实施例,提供了一种输入文本推荐方法。该方法可以用于前述图2a至图2c中即时通讯应用中加速对话文本输入的场景以及图3a至图3b中文档应用中加速文档编辑效率的场景中,该方法还可以应用于其他场景中进行文本输入效率进行提升。本公开将主要以方法应用于即时通讯应用中加速对话文本输入场景为例进行详细介绍。
如图4所示,为本公开提供的输入文本推荐方法的一个流程示意图。该方法可以应用于输入文本推荐装置,该输入文本推荐装置可以集成在计算机设备中,计算机设备可以为前述终端或服务器。该输入文本推荐方法可以包括:
步骤410,根据输入法客户端接收到的输入信息确定目标候选词。
其中,相关技术中,输入法应用已经具有良好的候选词预估和推荐的能力,例如当对象使用输入法客户端进行字符串输入时,输入法客户端可以根据对象输入的字符串预估出5个左右的候选词显示在输入法客户端的候选词推荐区域中,而对象想要输入的文本会较大概率出现在推荐显示的这5个左右的候选词中,该技术大大提升了词语输入的效率。然而,目前的输入法应用仅能实现词语级别的文本内容推荐,在大语言模型发展迅速的时代,根据输入的词语进行大篇幅的文本内容生成已经成为可能。例如采用ChatGPT模型,向该模型中输入几个关键词,该模型便可以生成完整的句子或者多个句子组成的段落、甚至是多个段落组成的文章等。ChatGPT等大语言模型的产生和广泛应用大大提升了基于少量关键词进行大篇幅文本内容生成的效率。基于该特性,相关技术中在输入法应用的客户端界面中提供了大语言模型的接入接口,当触发该接口后,便可以切换显示到基于大语言模型的内容生成应用中。如图5a所示,为相关技术中在输入法应用中集成大语言模型的示意图。当输入法的使用对象输入字符串后,输入法客户端在推荐文本显示区显示多个候选词以及大语言模型的接入接口510。响应于对大语言模型的接入接口510的触控操作,可以切换显示基于大语言模型的内容生成应用。如图5b所示,为相关技术中内容生成应用的界面示意图。如图所示,在内容生成应用的显示界面520中,包括提示词显示区域521和生成内容显示区域522。具体地,可以在提示词显示区域521中显示对象在输入法应用中选中的候选词,也可以重新输入其他词作为内容生成的提示。同时,在生成内容显示区域522中,可以显示生成的内容。生成的内容可以有一个候选句文本,也可以有多个候选句文本。在该内容生成应用中再次输入提示词,便可以使用该内容生成应用生成该输入对应的一条或多条较大篇幅的文本内容,例如一句文本内容或者由多句文本内容组成的段落等。输入法应用的使用对象可以在该内容生成应用生成的一条或多条文本内容中选取一条进行上屏显示。该方法可以在较大程度上提升大篇幅文本内容输入的输入效率。
然而,目前在输入法应用的客户端界面中提供大语言模型的接入接口的方案,一方面需要额外切换到另外的应用(即前述内容生成应用)中进行大篇幅文本内容的生成与推荐,导致了文本输入的效率下降。另一方面,由于在内容生成应用中基于大语言模型进行文本内容生成时,只依赖输入的关键词进行内容生成与推荐,导致生成的大篇幅的文本内容的准确性可能并不高,对象需要在多个推荐的大篇幅的文本内容中进行反复的查找以选取需要的大篇幅的文本内容,这也导致了文本输入效率的下降。
对此,本公开实施例提供的输入文本推荐方法,通过在输入法应用的内核中直接调用大语言模型,无需切换到基于大语言模型的内容生成应用,便可以直接在输入法客户端的推荐文本显示区中进行大篇幅的文本内容的推荐,提升了大篇幅的输入文本的推荐效率,进而可以提升文本输入的效率。此外,本公开提供的输入文本推荐方法,还可以利用输入法应用本身具有的强大的候选词推荐能力,根据对象输入的输入信息确定准确的目标候选词,然后在根据确定的准确的目标候选词在预设的句库中进行句子查找,确定出一定量的候选句;以及本方案还充分利用大语言模型的内容生成能力,通过向大语言模型输入多维度的提示信息来生成更为准确的候选句。即该方法利用句库推荐以及更准确的大语言模型内容生成来直接推荐更为准确的大篇幅的文本内容。如此便可以极大地提升文本输入的效率。
下面对本公开提供的输入文本推荐方法进行详细介绍。
首先,可以先根据输入法客户端接收到的输入信息确定目标候选词。其中,此处输入法客户端可以为任一输入法应用的任意一个输入法客户端。即此处不限制输入法应用的产品形态,例如不同商家开发的输入法应用,或者同一商家开发的适用于不同操作系统的输入法应用。对于同一输入法应用,输入法客户端的形态也不做限制,例如可以装载在个人电脑上的客户端,也可以为装载在智能手机上的客户端等。此处输入法客户端也可以为一个具体的输入法客户端,例如XX输入法在安卓系统智能手机上装载的客户端,而且当前输入法客户端登录了具体的用户账号。
输入法客户端接收到的输入信息具体可以为当前登录输入法客户端的对象输入的字符串,例如前述“afgy”,输入法应用可以根据对象输入的字符串在词库中进行精确的输入期望预测和匹配,预测出对象想要输入的候选词,并将预测出的多个候选词中输入期望评分最高的作为目标候选词。由于相关技术中输入法应用推荐的候选词中首选推荐成功(推荐的第一个候选词就是对象想要输入的词)的概率已经达到80%以上,因此直接根据期望评分最高的候选词作为目标候选词可以在较高准确率的基础实现高效确定目标候选词,进而可以提升文本输入效率。
其中,在一些实施例中,输入法客户端接收到的输入信息可以不仅包括对象输入的字符串,还可以包括时间信息(输入前述字符串时的时间信息)、地点信息(装载输入法应用的客户端的终端的定位信息)、上下文信息以及当前使用输入法应用的应用程序信息等。输入法应用根据上述信息在词库中进行词匹配,得到多个匹配的候选词,不同的候选词也可以得到不同的期望评分。然后,可以将期望评分最高的候选词确定为目标候选词。该实施例中,通过多个维度的信息来获取输入对象的输入习惯以及输入意图,从而可以确定出更为准确的目标候选词。
在一些实施例中,输入法客户端接收到的输入信息可以不仅包括对象输入的字符串,还可以包括对象对显示的多个候选词的选择信息。具体地,当对象在输入法客户端中输入字符串后,输入法客户端在推荐文本显示区中显示根据对象输入的字符串确定的多个候选词。然后,对象可以在显示的多个候选词中进行选择,将选中的候选词确定为目标候选词。具体地,对象可以触控多个候选词中的任意一个以选中其作为目标候选词;或者,对象可以将鼠标光标拖动到任意一个候选词以选中其作为目标候选词。即在本公开实施例中,可以根据对象选择的候选词来确定目标候选词。由于本公开提供的输入文本推荐方法所推荐的候选句文本为根据确定的目标候选词在句库中查找、以及根据确定的目标候选词采用大语言模型生成的,因此确定的目标候选词的准确性极大地影响了推荐的候选句文本的准确性,采用本公开提供的方法确定的目标候选词,通过预测并推荐展示与对象选择相结合的方式,可以确定最准确的目标候选词,进而可以极大地提升推荐的候选句文本的准确性。
步骤420,基于目标候选词在预设句库中确定至少一个第一候选句文本。
在本公开实施例中,输入法客户端接收到的输入信息揭示了对象的输入意图,如此根据输入法客户端接收到的输入信息确定的目标候选词便为对象的输入意图对应的目标候选词。在确定了对象的输入意图对应的目标候选词后,便可以基于目标候选词在预设句库中进行候选句文本的查找,得到至少一个候选句文本,此处具体可以称为第一候选句文本。本实施例中,输入法应用在客户端接收到输入信息后,不仅可以根据接收到的输入信息进行词推荐,还可以进一步根据最优推荐词来在句库中找到合适的句子以进行句子的推荐。句子推荐不仅可以降低对象进行文字输入的时间,还可以帮助对象进行文本内容的创作生成,降低对象思考需要输入的文本的时间,如此可以极大地提升对象的文本输入效率。
其中,预设句库可以为根据目标对象的输入历史生成的。例如可以获取目标对象在预设时间段内的历史输入文本信息,历史输入文本信息中可以包括多个句文本,句文本具体可以为一个句子或者多个句子组成的文本。目标对象可以为当前登录输入法客户端的对象,在获取到历史输入文本信息后,可以根据历史输入文本信息中的句文本生成预设句库。或者,预设句库也可以为根据某些特定的数据集生成的,例如通过获取XX百科中的文本信息、以及通过获取某些教科书中的文本信息,然后根据这些文本信息中的句文本生成预设句库。
预设句库可以按照一定的频率进行更新,以将新获取到的新的句文本添加到句库中,从而丰富句库的内容,使得能够根据目标候选词匹配到更合适的句文本。预设句库也可以设定一个最大句文本数量,例如可以设置为100万个,当句库中句文本数量达到该最大句文本数量时,当有新增的句文本时,便可以对句库中的另一些句文本进行删除。例如,可以获取句库中每一句文本的上屏次数和上屏时间,此处上屏次数为被推荐显示在输入法客户端的推荐文本显示区并被对象选中进行上屏显示的次数,上屏时间具体可以为最近一次被选中并进行上屏显示的时间。一般上屏次数越少,上屏时间距离当前时间越远的句文本越优先被删除。
在一些实施例中,预设句库还可以设置有对应的词库,词库中的词与句库中的句文本存在映射关系。句库中的词和句文本的存储具体可以采用key-value的结构进行存储。其中key对应的了词,而对应的value便为句文本。当需要对句库中的句文本进行删除时,可以根据对应的词的上屏次数和上屏时间来确定需要删除的句文本。
其中,在一些实施例中,基于目标候选词在预设句库中确定至少一个第一候选句文本,包括:
获取目标候选词对应的索引信息;
基于索引信息在预设句库中进行查找,得到至少一个第一候选句文本。
在本公开实施例中,预设句库中还可以存储有索引信息,在基于目标候选词在预设句库中确定候选句文本时,可以先获取该目标候选词对应的索引信息,然后可以基于索引信息在预设句库中进行查找,从而得到至少一个第一候选句文本。其中,索引信息具体可以为哈希索引,例如可以取每个候选词的前两个字的unicode码(一种标准字符编码)作为哈希索引。如此,在基于目标候选词进行候选句文本查找时,可以先采用目标候选词的前两个字来进行一轮定位,在定位到一个范围后再进行二轮的细致查询,如此可以提升根据目标候选词确定至少一个候选句文本的确定效率。
步骤430,获取输入法客户端的输入环境信息以及历史上屏文本。
其中,由于输入文本推荐方案中,推荐文本的准确性至关重要,如果推荐文本准确性较差,不仅无法提升对象进行文本输入的效率,甚至会对相应对象的文本输入行为造成反向的影响,即可能会降低对象进行文本输入的效率。例如当对象在输入法客户端中输入了字符串后,推荐的句文本与对象想要输入的完全不同,那么对象就得重新以词为单位或者以字为单位进行逐个的文本输入。甚至在一些情况下,还需要删除掉一些字符串以手动调整输入信息以改变推荐的文本内容,这样反而降低了对象的输入体验和输入效率。
对此,为了提升输入法应用进行句文本推荐的准确性,本公开实施例在提供句库查找进行句文本推荐的基础上进一步提供了集成大语言模型的句文本推荐方法。通过句库查找与大语言模型进行智能句文本生成的方式来联合确定向对象推荐的句文本,从而提升推荐的句文本的准确性,进而提升对象的文本输入效率。
其中,大语言模型具体为基于人工智能技术驱动的自然语言处理模型,该模型多用于智能聊天机器人产品中,因此又可以称为聊天生成预训练转换器。目前,已经有多家企业推出了基于大语言模型的聊天机器人产品,例如ChatGPT等。大语言模型的核心是自然语言的理解和文本内容的生成,其主体是深度学习模型,具体是采用了大量的文本数据进行训练得到的深度学习模型。训练后的大语言模型可以用于与对象进行聊天互动,或者根据对象的要求进行文本内容的生成,例如在本公开实施例中进行句文本的生成。一般情况下,对象输入的文本内容生成要求中包含的信息越详细越具体,大语言模型生产的文本内容越准确。因此,在本公开实施例中,在采用大语言模型进行句文本生成之前,可以先获取输入法客户端的输入环境信息以及历史上屏文本,以获得更为详细的信息作为大语言模型的输入。
其中,输入法客户端的输入环境信息,具体可以包括使用输入法应用进行文本输入的应用程序信息,例如对象在即时通讯应用中,使用输入法应用进行聊天时,使用输入法应用进行文本输入的应用程序便为该即时通讯应用;当对象在电商平台中购物时采用输入法应用输入想要购买的商品名称时,使用输入法应用进行文本输入的应用程序便为线上购物应用程序;当对象在线上书库中进行书籍查找时使用输入法应用输入需要查找的书籍名称时,使用输入法应用进行文本输入的应用程序便为在线阅读应用程序;以及当对象在进行文档编辑时,使用输入法应用进行文本输入的应用程序便为电子文档应用程序。当然,应用输入法应用进行文本输入的应用程序还有很多,此处不再一一列举。
输入法客户端的输入环境信息,还可以包括使用输入法应用进行文本输入的时间信息。其中,时间信息可以包括季节信息、月份信息、星期几(工作日或周末)、具体时间点信息(上午8点或下午8点等)等。对象在同一应用程序中采用输入法应用进行文本输入时,于不同的时间进行文本输入,可能期望输入的内容(或输入的习惯)也会存在差异。输入法客户端的输入环境信息,还可以包括使用输入法应用进行文本输入的地点信息。其中,地点信息可以由装载输入法客户端的终端的定位信息来确定,具体可以包括国家信息、省份信息、城市信息等;或者,这些地点信息也可以具有相应的标签,例如公司、家、体育场等。此外,输入环境信息还可以包括天气信息,具体可以由装载输入法客户端的终端中的温度传感器等采集到的信息;输入环境信息还可以包括运动状态信息,具体可以由装载输入法客户端的终端中的陀螺仪采集得到的信息等。
其中,输入法客户端的历史上屏文本具体可以包括输入法客户端在预设时间段内推荐的文本内容中被选中并进行上屏显示的文本内容。此处预设时间段可以由输入法应用系统默认,例如一个月;也可以由登录输入法客户端的对象进行自行设置,例如设置为一周。上屏显示的文本内容具体可以为词文本或句文本,当输入法客户端只进行候选词推荐时,被选中并上屏的候选词便可以为历史上屏文本;当输入法客户端即进行候选词推荐,也进行候选句推荐,那么被选中并上屏显示的候选词或候选句都可以为历史上屏文本。在一些实施例中,输入法应用的历史上屏文本也可以在应用输入法应用进行文本输入的应用程序中进行获取,例如当在即时通讯应用程序中采用输入法应用进行文本输入时,那么便可以获取即时通讯应用中在预设时间段内的对话文本,并将预设时间段内的对话文本确认为历史上屏文本;当在文档应用中采用输入法应用进行文本输入时,可以将预设时间段内文档应用中新增的文本内容作为历史上屏文本。其中,预设时间段内即时通讯应用中的对话文本不仅包括了输入法应用输入上屏的文本,还包括了通讯对象输入上屏的文本,可以得到更为丰富的历史文本信息。而文档应用中,输入法应用输入上屏的文本中也可能存在一些不合适的内容被对象进行删除,那么根据文档应用中预设时间内新增的文本作为历史上屏文本,可以提升确定的历史上屏文本的准确性,进而可以提升大语言模型生成的文本内容的准确性。
步骤440,将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本。
在获取到输入法客户端的输入环境信息、历史上屏信息后,便可以将根据输入法客户端接收到的输入信息确定的目标候选词、输入环境信息以及历史上屏信息,采用大语言模型进行内容生成。具体地,可以将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行文本内容生成,然后接收大语言模型返回的句文本,此处句文本具体可以称为第二候选句文本。具体地,将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,具体可以先根据目标候选词、输入环境信息以及候选句文本进行内容整理,生成对大语言模型进行问询的问询文本,然后将该问询文本发送给大语言模型进行问询,大语言模型对该问询文本作出答复,即生成该问询文本对应的答复文本。当在问询文本中要求答复以句子的形式作出时,答复文本便可以为句文本,句文本具体可以为一句或多句构成的文本。
在一些实施例中,将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本,包括:
将目标候选词、输入环境信息以及历史上屏文本分多个轮次发送给大语言模型进行多轮内容生成;
根据大语言模型最后一轮输出的生成内容确定第二候选句文本。
其中,由于目标候选词、输入环境信息以及历史上屏文本之间可能并不存在着很强的关联性,若在一轮问询中将这些信息同时输入到大语言模型中进行内容文本生成,可能会导致大语言模型无法确定不同信息之间的重要性差异,进而导致大语言模型生成的文本内容的准确性较低。因此,在本公开实施例中,通过多轮问询的方式将目标候选词、输入环境信息以及历史上屏文本分多轮发送给大语言模型进行多轮的内容生成。在每一轮向大语言模型进行问询时,向大语言模型输入目标候选词、输入环境信息或历史上屏文本中的任意一项,以使得大语言模型能够明确当前轮问询的重心,从而生成更为准确的答复文本。其中,在基于目标候选词、输入环境信息以及历史上屏文本对大语言模型进行多轮问询时,下一轮问询可以基于前一轮问询的结果进行优化,而本轮优化的重心便是基于该轮输入到大语言模型的信息。然后,在基于目标候选词、输入环境信息以及历史上屏文本对大语言模型进行多轮问询,即基于大语言模型进行多轮内容生成后,可以将大语言模型最后一轮内容生成并输出的句文本作为第二候选句文本。其中,本公开实施例中,大语言模型进行多轮内容生成过程中,每一轮所依赖的信息可以按照一定的顺序进行安排,也可以不作顺序上的限制。
在一些实施例中,将目标候选词、输入环境信息以及历史上屏文本分多个轮次发送给大语言模型进行多轮内容生成,包括:
将目标候选词与输入环境信息发送给大语言模型进行内容生成,并接收大语言模型输出的第一中间生成内容;
将历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型输出的第二中间生成内容;
获取目标候选词的领域信息对应的领域词,并将领域词发送给大语言模型进行内容生成;
根据大语言模型最后一轮输出的生成内容确定第二候选句文本,包括:
根据第三轮内容生成得到的生成内容确定第二候选句文本。
其中,在本公开实施例中,可以采用三轮问询的方式基于大语言模型生成第二候选句文本。具体地,可以首先将目标候选词与输入环境信息发送给大语言模型进行内容生成,得到大语言模型输出的第一中间生成内容。然后将历史上屏文本发送给大语言模型进行第二轮的内容生成,在第二轮的内容生成中,大语言模型可以对第一中间生成内容进行基于历史上屏文本中抽取的信息的调整,得到输出的第二中间生成内容。
进一步地,在本公开实施例中,还可以进一步获取目标候选词的领域信息对应的领域词,并将该领域词发送给大语言模型进行第三轮的内容生成,在第三轮的内容生成中,大语言模型可以基于该领域词对第二中间生成内容的表达方式进行调整,以使得生成内容的表达方式符合该领域词对应的领域内人员的表达方式。然后,便可以将第三轮内容生成得到的生成内容确定为第二候选句文本。本方法不仅可以生成较为准确的句文本,还可以使得句文本的表达方式更合理,在一些特定场景下,例如工作沟通场景下,由于大语言模型考虑了目标候选词的领域信息,使得生成的句文本的表达方式更符合相应领域的表达习惯,如此便可以使得工作沟通更为自然,避免了生成文本的智能生成痕迹过于明显从而影响沟通体验的问题,从而极大提升输入效率和沟通体验。
在一些实施例中,将目标候选词与输入环境信息发送给大语言模型进行内容生成,并接收大语言模型输出的第一中间生成内容,包括:
根据输入环境信息确定生成内容的篇幅信息和表达方式信息;
将目标候选词、篇幅信息以及表达方式信息发送给大语言模型进行内容生成,并接收大语言模型输出的第一中间生成内容。
在本公开实施例中,当输入法客户端的输入环境信息为使用输入法应用进行文本输入的应用程序信息时,可以先根据输入环境信息确定生成内容的篇幅信息和表达方式信息。其中,在不同的应用程序中,输入的文本信息的篇幅和表达方式之间也存在着差异。例如在即时通讯应用和文档应用中,输入的文本信息的篇幅和表达方式之间就存在着明显的差异。即时通讯应用一般都是用来对话和聊天,一般情况下需要输入的文本内容的篇幅较小,因此当根据输入法客户端的输入环境信息确定当前输入法应用用于即时通讯应用中进行句文本生成推荐时,可以确定生成的句文本的篇幅为小篇幅,具体可以限定为一句话或两句话。同时,还可以确定当前的表达方式为口语化表达方式。而文档应用一般用于进行详细的内容表达,而且表达方式一般为书面的表达,因此当根据输入法应用的输入环境信息确定当前使用输入法应用进行文本输入的应用程序为文档应用时,则可以确定大语言模型需要生成的句文本的篇幅为大篇幅,例如3句以上的篇幅;而且,生成的句文本的表达方式具体可以为书面表达的表达方式。
在根据输入环境信息确定了生成内容的篇幅信息和表达方式信息后,便可以将目标候选词、篇幅信息以及表达方式信息发送给大语言模型进行内容生成,得到输出的第一中间生成内容。
在一些实施例中,获取目标候选词的领域信息对应的领域词,包括:
将目标候选词发送给目标服务器进行领域词分析;
接收目标服务器返回的领域词。
在本公开实施例中,为进一步提升目标候选词的领域信息对应的领域词确定的准确性,可以采用专用的领域词服务器来确定目标候选词对应的领域词。具体地,可以将目标候选词发送给用于领域词确定的目标服务器(即前述领域词服务器),目标服务器中可以存储有一个哈希表,该哈希表用于存储词条和领域词之间的对应关系。当目标服务器接收到目标候选词后,便可以将接收到的候选词与哈希表进行匹配,然后将匹配确定的领域词返回给输入法服务器。
其中,在一些实施例中,目标候选词可能在多个领域中出现,导致目标服务器中存储的哈希表中目标候选词对应的词条可能对应多个领域词。在该场景下,目标服务器可以进一步向输入法服务器发出信息获取请求,以使得输入法服务器向目标服务器发送输入法应用中的历史上屏文本信息,然后目标服务器根据历史上屏文本信息确定目标候选词对应的领域词,并将该领域词返回给输入法服务器。在本实施例中,领域词服务器在接收到需要进行领域词确定的目标候选词时,可以结合发送该目标候选词的输入法应用的历史输入信息来确定目标候选词对应的领域词,从而可以确定更为准确的领域词。如此,可以进一步提升大语言模型生成的句文本的准确性。
步骤450,在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。
其中,在从预设句库中确定了至少一个第一候选句文本,以及利用大语言模型根据目标候选词、输入环境信息以及历史上屏文本生成了第二候选句文本后,便可以在多个第一候选句文本和第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。其中,目标候选句文本可以为一个候选句文本,也可以为多个候选句文本。当在输入法客户端的推荐文本显示区显示这一个或多个候选句文本后,输入法应用的使用对象便可以直接在输入法客户端中选取需要输入的候选句文本,并将选中的候选句文本进行上屏显示。如此,通过本公开提供的方案,输入法应用的使用对象只需输入几个字符组成的字符串(相关技术中该字符串只能推荐候选词),便可以直接实现句文本的输入。而且,该过程无需切换到其他应用进行重新输入以及内容生成,从而可以大大提升文本输入效率。
在一些实施例中,在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示,包括:
获取每一第一候选句文本的历史上屏信息;
根据历史上屏信息对至少一个第一候选句文本进行重要性排序;
将重要性排序在前的预设数量个第一候选句文本与第二候选句文本确定为目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。
其中,在一些实施例中,由于输入法客户端的推荐文本显示区空间有限,而且句文本的显示所占的空间也较大,当根据目标候选词在词库中确定的第一候选句文本较多时,无法在推荐文本显示区将所有的第一候选句文本以及大语言模型生成的第二候选句文本进行完全的显示。因此,在确定了多个第一候选句文本和第二候选句文本后,需要先在多个第一候选句文本和第二候选句文本组成的候选句文本组集合中进行筛选,确定目标候选句文本。具体地,可以先确定上述候选句文本集合中的每一候选句文本的重要性排序,然后可以根据重要性排序以及排序在先的候选句文本的文本篇幅来确定目标候选句文本。具体地,可以先确定重要性排序在第一位的候选句文本的文本篇幅,并将其与输入法客户端的推荐文本显示区的空间进行比对,当推荐文本显示区的空间大于最重要的候选句文本时,可以先确定将最重要的候选句文本在推荐文本显示区进行显示。然后确定第二重要的候选句文本的篇幅,若推荐文本显示区已经无法容纳第二重要的候选区文本,那么便可以确定最重要的候选句文本为目标候选句文本,仅在输入法客户端的推荐文本显示区显示最重要的候选句文本。若推荐文本显示区可以容纳最重要的和第二重要的候选句文本,那么便可以确定这两个句文本为目标候选句文本。以此类推,最终根据推荐文本显示区的空间和候选句文本的重要性排序以及篇幅大小来综合确定进行推荐显示的目标候选句文本。
在一些实施例中,也可以设置进行推荐显示的目标候选句文本的数量,当默认的推荐文本显示区的空间不足时,输入法应用可以自动调节推荐文本显示区的空间,以容纳预设数量的目标候选句文本。在该实施例中,具体可以根据候选句文本集合中每一候选句文本的历史上屏信息来确定每一候选句文本的重要性排序。而大语言模型生成的第二候选句文本理论而言是没有历史上屏信息的,因此可以先获取每一第一候选句文本的历史上屏信息,然后根据历史上屏信息对至少一个第一候选句文本进行重要性排序,并将重要性排序在前的预设数量个第一候选句文本和第二候选句文本确定为目标候选句文本。
在一些实施例中,历史上屏信息包括历史上屏时间信息以及历史上屏次数信息,根据历史上屏信息对至少一个第一候选句文本进行重要性排序,包括:
根据历史上屏时间确定每一第一候选句文本的第一重要性权重系数;
根据历史上屏次数信息确定每一第一候选句文本的第二重要性权重系数;
基于第一重要性权重系数和第二重要性权重系数对至少一个第一候选句文本进行重要性排序。
在本公开实施例中,历史上屏信息包括了历史上屏时间信息和历史上屏次数信息。如此,根据历史上屏信息对多一个第一候选句文本进行重要性排序的过程,便可以实际根据历史上屏时间信息和历史上屏次数信息对多个第一候选句文本进行重要性排序。其中,可以确定历史上屏次数越多的第一候选句文本的重要性越高,以及历史上屏时间距离当前时间越近的第一候选句文本的重要性越高。本实施例中,可以先根据历史上屏时间确定每一第一候选句文本的第一重要性权重系数,以及根据历史上屏次数信息确定每一第一候选句文本的第二重要性权重系数。然后,基于第一重要性权重系数和第二重要性权重系数对至少一个第一候选句文本进行重要性排序,便可以得到多个第一候选句文本的准确的重要性排序结果。
在一些实施例中,将重要性排序在前的预设数量个第一候选句文本与第二候选句文本确定为目标候选句文本,包括:
将重要性排序在前的预设数量个第一候选句文本与第二候选句文本组成的句文本集合进行去重;
根据去重后得到的多个候选句文本确定目标候选句文本。
在本公开实施例中,随着句库中的存储的句文本的内容越来越丰富和准确,大语言模型根据目标候选词、输入法客户端的输入环境信息以及历史上屏文本生成的第二候选句文本就越有可能与根据目标候选词从句库中确定的多个第一候选句文本中的某一候选句文本相同或者相似。为了避免向对象推荐显示相同的候选句文本,本实施例中在确定了目标候选句文本后,可以进一步对目标候选句文本中的多个候选句文本进行去重处理,然后根据去重得到的多个候选句文本重新确定目标候选句文本。
具体地,将重要性排序在前的预设数量个第一候选句文本与第二候选句文本组成的句文本集合进行去重的具体过程,可以为计算第二候选句文本与每一第一候选句文本之间的相似度。然后,当存在与第二候选句文本之间的相似度大于预设阈值,例如80%的第一候选句文本时,便可以将这些与第二候选句文本之间的相似度大于该预设阈值的第一候选句文本在目标候选句文本中进行剔除。
其中,在一些实施例中,输入法客户端对目标候选句文本进行推荐显示,包括如下步骤:
显示输入法客户端的文本输入界面,文本输入界面包括输入字符串显示区和推荐文本显示区;
在推荐文本显示区显示目标候选句文本。
在本公开实施例中,输入法客户端在接收到需要进行推荐显示的目标候选句文本,便可以将目标候选句文本在输入法客户端的推荐文本显示区进行显示。如图6所示,为本公开中提供的输入法客户端的显示界面示意图。输入法客户端的显示界面包括了输入字符串显示区610和推荐文本显示区620。然后,可以将确定的目标候选句文本在推荐文本显示区620中进行显示。其中,推荐文本显示区620中显示两个目标候选句文本只是一个示例,目标候选句文本可以为更多个,可以在推荐文本显示区620中通过滚动或者翻页的方式切换推荐文本显示区620中显示的目标候选句。具体地,可以将重要性最高的目标候选句文本进行优先显示,当向下翻页时,逐步显示重要性相对较低的目标候选句文本。
如图7所示,为本公开提供的输入法客户端的显示界面的另一示意图。如图所示,输入法客户端的推荐文本显示区620可以包括推荐词显示区721和推荐句显示区722。可以在推荐词显示区721中显示目标候选词,以及在推荐句显示区显示目标候选句文本。一般目标候选词就是一个词,而目标候选句文本可以为一个句文本也可以为多个句文本。输入法应用的使用对象可以根据推荐词显示区721中显示的目标候选词来检验基于输入的字符串确定的目标候选词是否正确。当输入法应用的使用对象确定输入法应用根据输入的字符串自动确定的目标候选词并不是期望输入的候选词时,可以通过删除或者更改输入的字符串以调整输入法应用确定的目标候选词。或者,也可以在输入法客户端的显示界面中设置模式切换控件,响应于对该模式切换控件的触发操作,可以切换为只显示候选词的显示界面。在只显示候选词的显示界面中可以显示多个候选词,对象便可以在这多个候选词中选取期望输入的候选词。然后,可以再次触发模式切换控件,此时便可以将对象选中的候选词作为目标候选词,并基于该目标候选词进行候选句推荐。
即在推荐文本显示区显示目标候选句文本之前,还包括:
响应于接收到的字符串输入操作,在输入字符串显示区显示输入的目标字符串,在推荐文本显示区显示多个推荐候选词;
响应于接收到的候选词选取操作,在多个推荐候选词中确定目标候选词;
响应于接收到的推荐候选内容切换指令,基于目标候选词确定目标候选句文本。
在一些实施例中,在推荐文本显示区显示目标候选句文本之后,还包括:
响应于对推荐文本显示区显示的文本的选择上屏操作,将被选中的文本在目标应用的文本显示区域进行上屏显示,选中的文本为候选词或候选句;
在输入法客户端的文本输入界面显示至少一个候选推荐文本,候选推荐文本为根据目标应用的上下文信息、选中的文本以及目标应用的应用程序信息生成的句文本。
其中,在本公开实施例中,当输入法客户端的推荐文本显示区中显示的目标候选词或者目标候选句文本中的任一项被输入法使用对象选择并进行上屏显示后,可以自动切换为二次推荐模式。二次推荐模式可以自动根据已经被选择上屏显示的文本生成进一步可能需要输入的文本并在输入法客户端的二次推荐候选界面中进行显示。如图8所示,为本公开提供的输入法客户端的显示界面的又一示意图。如图所示,在输入法客户端的显示界面中,显示了二次推荐候选界面810,在二次推荐候选界面810中,可以显示多个二次推荐的候选句文本。其中,此处二次推荐的候选句文本可以为根据选择上屏的文本内容进行再次推荐生成的内容。
在一些实施例中,在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示之后,还包括:
获取目标候选句文本中被选择上屏的目标句文本;
根据目标句文本更新预设句库。
在本公开实施例中,当输入法服务器将确定的目标候选句文本发送给输入法客户端进行推荐显示,输入法应用的使用对象在推荐显示的多个目标候选句中选中任一目标候选句并将选中的目标候选句在即时通讯应用的文本输入区域进行上屏显示后。输入法服务器可以进一步获取目标候选句文本中被选择上屏的目标句文本,然后根据该目标句文本对预设句库进行更新。
即本公开实施例中,预设句库是在输入法应用的使用对象使用过程中会不断地学习更新的。随着不断输入法应用不断地使用,预设句库中的句文本也在不断地丰富,从而也使得根据每次输入的字符串确定的目标候选词查找到的候选句文本的准确性也在不断地提升。
在一些实施例中,根据目标句文本更新预设句库,包括:
建立目标候选词与目标句文本之间的映射关系;
基于映射关系对预设句库中目标候选词对应的句文本进行更新。
在本公开实施例中,根据选择上屏的目标句文本对预设句库进行更新的具体过程,可以为先建立目标候选词与目标句文本之间的映射关系。然后,根据该映射关系对预设句库中目标候选词对应的句文本进行更新。即在预设句库中,可以已经存在目标候选词对应的句文本,此处可以称为历史句文本。可以理解的是,当对象输入的字符串确定了目标候选词,根据目标候选词在原有句库中进行查找,得到的第一候选句文本中应当包含历史句文本,当将历史句文本和大语言模型生成的第二候选句文本同时作为目标候选句文本发送给输入法客户端以推荐给输入法应用的使用对象进行选择时,输入法应用的使用对象有较大概率会选择该历史句文本。但如果使用对象没有选择该历史句文本进行上屏显示,说明大语言模型新生成的第二候选句文本更符合使用对象的期望,因此将新生成的第二候选句文本进行选择上屏显示。此时,便可以将大语言模型新生成的第二候选句文本确定为被对象选择上屏的目标句文本,然后建立目标候选词与目标句文本之间的映射关系。
在基于该映射关系对预设句库进行更新时,即可以将预设句库中原本与目标候选词存在映射关系的历史句文本更换为大语言模型新生成的目标句文本。如此可以保证预设句库中存储的句文本能够始终保持与对象的输入习惯相匹配,即使对象的输入习惯随时间变化发生变化也能保持预设句库中候选词对应的句文本的准确性。
综上,采用本公开提供的输入文本推荐方法,通过根据输入法客户端接收到的输入信息确定目标候选词;基于目标候选词在预设句库中确定至少一个第一候选句文本;获取输入法客户端的输入环境信息以及历史上屏文本,历史上屏文本为输入法客户端展示的候选文本中被选中并上屏显示的词或句;将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本;在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。以此,采用本公开提供的输入文本推荐方法,可以根据输入法客户端接收到的输入信息、输入环境信息以及输入法客户端的历史上屏文本来确定候选句文本,并将确定的候选句文本直接在输入法客户端的输入推荐界面进行推荐显示。如此,输入法客户端的使用对象可以直接进行整句的选择输入,从而可以大大提升文本输入的效率。
本公开实施例结合具体应用场景的详细说明
如图9所示,为本公开提供的输入文本推荐方法的另一流程示意图。在本公开实施例中,将结合具体的硬件执行模块对本公开提供的输入文本推荐方法进行详细的介绍。方法具体包括如下步骤:
步骤901,终端接收经输入法客户端输入的字符串,并将字符串发送给输入法服务器进行查词。
本公开提供的输入文本推荐方法,充分利用了输入法应用的准确的候选词推荐能力以及大语言模型的准确的内容生成能力,利用输入对象输入的少量的字符串,便可以生成多个候选句并推荐给输入对象进行选择。如此,输入对象只需输入少量的字符串便可以输入一整个句子文本或者一段文本(多个句子文本)。相对于相关技术中只能进行词级别的文本输入,可以极大提升文本输入的效率。下面对本公开提供的输入文本推荐方法进行详细介绍。
在本公开实施例中,将以具体的文本输入场景为例对本公开提供的输入文本推荐方法进行详细介绍。其中,在本方法提供的输入文本推荐方法应用的系统具体可以包括如下几个交互方:终端、输入法服务器、领域词服务器以及大语言模型。其中,终端具体可以为装载输入法应用客户端的终端,具体可以为智能手机、个人电脑、平板电脑以及车载终端等终端。终端中除了装载有输入法客户端,还可以装载其他应用程序,在其他应用程序中,可以使用输入法客户端进行文本输入。在基于输入法客户端进行文本输入时,输入法客户端会显示输入对象输入的字符串以及输入法客户端基于输入的字符串进行推荐的候选词或候选句。输入法服务器具体可以为输入法应用的服务器,用于进行输入法应用的账户管理、响应输入法客户端接收到的输入信息进行候选词推荐以及候选句推荐等,输入法服务器中设有词库以及句库。大语言模型具体指部署了大语言模型的设备,可以为终端也可以为服务器,大语言模型具有内容生成功能,在本公开中具体用于根据输入法服务器发送的目标候选词、应用程序信息、输入上文信息以及领域词来生成候选句。领域词服务器可以为专用服务器,主要用于对目标候选词生成其对应的领域词,以便为大语言模型进行更精确的内容生成提供更多参考信息。
首先,当输入对象需要在应用程序中进行文本输入时,可以通过输入操作触发显示终端中装载的输入法客户端的显示界面。然后,输入对象可以继续输入字符串,输入法客户端接收输入对象输入的字符串后,便可以将接收到的字符串发送给输入法服务器进行查词。
步骤902,输入法服务器根据接收到的字符串查询得到多个候选词,并将多个候选词发送给终端。
输入法服务器在接收到输入法客户端经终端发送的字符串后,便可以基于接收到的字符串在词库中进行查词,得到多个候选词。然后,输入法服务器可以进一步将查词得到的多个候选词发送给终端进行推荐显示。
步骤903,终端根据候选词的打分将打分较高的多个候选词在输入法客户端的候选词推荐显示区域进行推荐显示。
终端在接收到输入法服务器发送的多个候选词后,可以先确定多个候选词的排序顺序,排序顺序具体可以由输入法服务器在向终端发送多个候选词时同时发送。在确定了多个候选词的排序顺序后,便可以将排序在前的一定数量个候选词在输入法客户端的候选词推荐显示区域中进行推荐显示。其中,上述几个步骤与相关技术中基于词为单元的输入文本推荐类似,此处不再予以赘述。
步骤904,终端接收对候选词推荐显示区域中候选词的选择操作以及候选句查询指令,根据选择操作确定目标候选词并将目标候选词发送给输入法服务器。
在相关技术中,当输入对象对显示在候选词推荐显示区域中的任一候选词进行选中后,便会将选中的候选词进行上屏显示。而在本公开实施例中,输入对象可以在候选词推荐显示区域中选择一个候选词作为目标候选词,该选择操作可以为点击某一候选词,或者为将鼠标光标移动至某一候选词处。当选中了目标候选词后,输入对象还可以进一步输入候选句查询指令。候选句查询指令具体可以通过触发输入法客户端的显示界面中显示的控件来实现,也可以通过语义指令来实现。该指令指示基于输入对象选中的目标候选词进行候选句生成及推荐,该指令具体可以将输入法应用的输入模式由普通输入模式(以词为单元进行输入)切换为智能输入模式(可以直接进行句输入)。
当切换为智能输入模式时,终端可以将确定的目标候选词发送给输入法服务器进行候选句生成。
步骤905,输入法服务器根据目标候选词在句库中进行候选句查找,得到多个第一候选句。
当输入法服务器接收到目标候选词后,可以先根据目标候选词在输入法服务器中的句库中进行候选句查找。具体地,可以先确定目标候选词的前两个字对应的编码信息,根据该编码信息进行一轮查找,以确定一个候选句范围。然后,可以进一步根据目标候选词在第一轮确定的候选句范围中进行精确查找,从而确定目标候选词对应的多个第一候选句。例如当目标候选词为“按份共有”时,可以根据目标候选词在句库中查找得到多个第一候选句“按份共有是指XXXXXX”、“按份共有表示XXXXXXX”以及“按份共有是一种分配XXXXX”。
步骤906,输入法服务器获取使用输入法的应用程序信息和最近预设数量次的输入上文信息,并将应用程序信息、输入上文信息以及目标候选词发送给大语言模型进行候选句生成。
在本公开实施例中,输入法服务器在进行候选句确定时,除了根据目标候选词在句库中进行候选句查找,还可以利用大语言模型的准确的内容生成能力进行候选句生成。为了提升大语言模型生成的候选句的准确性,输入法服务器可以进一步获取使用输入法的应用程序信息以及输入法最近一定次数输入上屏的文本信息,例如输入词或输入句信息,具体例如最近10次输入的上文信息。应用程序信息具体可以为即时通讯应用、文档应用等。
当获取到应用程序信息以及输入上文信息后,输入法服务器可以将应用程序信息、输入上文信息以及目标候选词一同发送给大语言模型进行候选句生成。
步骤907,大语言模型模型根据接收到的应用程序信息、输入上文信息以及目标候选词进行候选句生成,得到第二候选句,并将第二候选句发送给输入法服务器。
当大语言模型接收到输入法服务器发送的应用程序信息、输入上文信息以及目标候选词后,便可以基于接收到的应用程序信息、输入上文信息以及目标候选词进行内容生成。具体地,大语言模型可以先分别根据应用程序信息、输入上文信息以及目标候选词分别生成问询信息,然后基于这些问询信息向大语言模型进行问询,以使得大语言模型根据这些问询信息进行相应的内容生成,得到第二候选句。其中,在根据应用程序信息、输入上文信息等生成问询信息时,可以进一步明确对大语言模型进行内容生成的要求,例如当应用程序信息为即时通讯应用时,可以要求大语言模型生成的候选句的表达方式为口语表达;当应用程序为文档应用时,可以要求大语言模型生成的候选句的表达方式为书面表达。
具体地,大语言模型根据应用程序信息、输入上文信息以及目标候选词生成的问询信息进行内容生成的具体过程,可以为根据多个问询信息进行多轮的问询,得到第二候选句。大语言模型在生成第二候选句后,便可以将生成的第二候选句发送给输入法服务器。
其中,由于应用程序信息、输入上文信息以及目标关键词可以在较大程度上揭示输入对象的输入意图,从而可以使得大语言模型根据这些信息生成与输入对象的输入意图相匹配的候选句。
步骤908,输入法服务器将目标候选词发送给领域词服务器进行领域词查找,并接收领域词服务器返回的领域词。
此外,本公开实施例中,为进一步提升大语言模型生成的候选句的准确性,输入法服务器可以进一步将目标候选词发送给领域词服务器以确定目标候选词对应的领域词,并接收领域词服务器返回的领域词。
其中,输入法服务器具体可以通过输入法客户端将目标候选词透传给领域词服务器,领域词服务器在接收到输入法服务器发送的目标候选词,便可以根据其中存储的哈希表进行目标候选词的领域词查询。领域词服务器中存储的哈希表中存储了大量的词条与领域词之间的对应关系,当接收到输入法服务器发送的目标候选词后,便可以进行哈希匹配,从而得到对应的领域词。
步骤909,输入法服务器再次将领域词发送给大语言模型进行内容生成,并接收大语言模型返回的第三候选句。
输入法服务器接收到领域词服务器返回的目标候选词对应的领域词后,便可以进一步将领域词发送给大语言模型进行进一轮的内容生成。进一轮的内容生成具体可以为在第二候选句的基础上结合领域词进行进一步优化得到的生成内容,此处可以称为第三候选句。由于不同领域的人员在对事件、知识等进行表达时也会存在表达方式和结构上的差异,因此本公开中通过进一步确定目标候选词对应的领域词,再将领域词输入至大语言模型以结合前述信息进行联合的内容生成,便可以得到更为准确的第三候选句。
步骤910,输入法服务器对多个第一候选句和第三候选句组成的候选句集合进行去重,并对去重后的多个候选句进行排序。
当句库中候选词对应的候选句比较准确时,便可能存在由大语言模型生成的第三候选句与多个第一候选句中的某一第一候选词句相同或者相似的情况。为避免在进行候选句推荐时推荐相同的候选句,可以在确定多个第一候选句以及第三候选句后,对由多个第一候选句与第三候选句组成的候选句集合进行去重。具体地,可以将多个第一候选句中与第三候选句的相似度大于80%的句文本进行剔除,从而得到去重后的多个候选句。
进一步地,对于去重后的多个候选句,输入法服务器可以进一步进行排序。对于从句库中查找到的多个第一候选句,可以根据候选句的上屏次数以及上屏时间距离当前时间的时间差来确定重要性。具体地,上屏次数越多,最近上屏时间距离当前时间的时间差越小,则说明候选句的重要性越高,则其排序顺序就越靠前。
步骤911,输入法服务器将去重后得到的多个候选句发送给终端。
输入法服务器在对去重后的多个候选句进行排序后,便可以进一步将去重后得到的多个候选句以及多个候选句之间的排序顺序一同发送给终端进行推荐显示。
步骤912,终端将接收到的多个候选句按顺序在输入法客户端的候选句推荐显示区域中进行显示。
终端接收到输入法服务器发送的多个候选句以及候选句之间的排序顺序后,便可以将接收到的多个候选句根据排序顺序在输入法客户端的候选句推荐显示区域中进行显示。输入法客户端的显示界面中也可以还包括候选词推荐显示区域,可以在候选词推荐显示区域中显示目标候选词。
在一些情况下,当输入法服务器发送的候选句的数量较多,例如5个,而由于候选句推荐显示区域的空间有限,例如只能显示2个候选句。此时可以先显示排序在最前的2个候选句进行显示,然后,可以响应于接收到的翻页操作,切换显示排序第三和第四的2个候选句。以此类推,可以通过翻页操作显示所有候选句。
步骤913,终端接收对显示的多个候选句的选择操作,将选中的目标候选句进行上屏显示。
当终端将接收到的多个候选句按照排序顺序在候选句推荐显示区域进行显示后,输入对象便可以对推荐显示的候选句进行选择并将选中的目标候选句进行上屏显示。
步骤914,终端将选中的目标候选句发送给输入法服务器进行句库更新。
当输入对象在推荐显示的多个候选句中选中了目标候选句进行上屏显示后,终端可以进一步将输入对象选中的目标候选句发送给输入法服务器。输入法服务器接收到输入对象选中并上屏显示的目标候选句后,便可以进一步基于目标候选句对输入法服务器中的句库进行更新。如此,输入法服务器中的句库便可以进行持续学习,从而可以进一步提升确定的候选句的准确性。
本公开实施例的装置和设备描述
可以理解的是,虽然上述各个流程图中的各个步骤按照箭头的表征依次显示,但是这些步骤并不是必然按照箭头表征的顺序依次执行。除非本实施例中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时间执行完成,而是可以在不同的时间执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
需要说明的是,在本公开的各个具体实施方式中,当涉及到需要根据目标对象属性信息或属性信息集合等与目标对象特性相关的数据进行相关处理时,都会先获得目标对象的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关地区的相关法律法规和标准。此外,当本申请实施例需要获取目标对象属性信息时,会通过弹窗或者跳转到确认页面等方式获得目标对象的单独许可或者单独同意,在明确获得目标对象的单独许可或者单独同意之后,再获取用于使本申请实施例能够正常运行的必要的目标对象相关数据。
图10为本公开实施例提供的输入文本推荐装置1000的结构示意图。该输入文本推荐装置1000包括:
第一确定单元1010,用于根据输入法客户端接收到的输入信息确定目标候选词;
第二确定单元1020,用于基于目标候选词在预设句库中确定至少一个第一候选句文本;
获取单元1030,用于获取输入法客户端的输入环境信息以及历史上屏文本,历史上屏文本为输入法客户端展示的候选文本中被选中并上屏显示的词或句;
发送单元1040,用于将目标候选词、输入环境信息以及历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型返回的第二候选句文本;
第三确定单元1050,用于在至少一个第一候选句文本与第二候选句文本中确定目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。
可选地,在一些实施例中,发送单元,包括:
发送子单元,用于将目标候选词、输入环境信息以及历史上屏文本分多个轮次发送给大语言模型进行多轮内容生成;
第一确定子单元,用于根据大语言模型最后一轮输出的生成内容确定第二候选句文本。
可选地,在一些实施例中,发送子单元,包括:
第一发送模块,用于将目标候选词与输入环境信息发送给大语言模型进行内容生成,并接收大语言模型输出的第一中间生成内容;
第二发送模块,用于将历史上屏文本发送给大语言模型进行内容生成,并接收大语言模型输出的第二中间生成内容;
获取模块,用于获取目标候选词的领域信息对应的领域词,并将领域词发送给大语言模型进行内容生成;
第一确定子单元,还用于:
根据第三轮内容生成得到的生成内容确定第二候选句文本。
可选地,在一些实施例中,第一发送模块,包括:
确定子模块,用于根据输入环境信息确定生成内容的篇幅信息和表达方式信息;
第一发送子模块,用于将目标候选词、篇幅信息以及表达方式信息发送给大语言模型进行内容生成,并接收大语言模型输出的第一中间生成内容。
可选地,在一些实施例中,获取模块,包括:
第二发送子模块,用于将目标候选词发送给目标服务器进行领域词分析;
接收子模块,用于接收目标服务器返回的领域词。
可选地,本公开提供的输入文本推荐装置,还包括:
第一获取子单元,用于获取目标候选句文本中被选择上屏的目标句文本;
更新子单元,用于根据目标句文本更新预设句库。
可选地,在一些实施例中,更新子单元,包括:
建立模块,用于建立目标候选词与目标句文本之间的映射关系;
更新模块,用于基于映射关系对预设句库中目标候选词对应的句文本进行更新。
可选地,在一些实施例中,第三确定单元,包括:
第二获取子单元,用于获取每一第一候选句文本的历史上屏信息;
排序子单元,用于根据历史上屏信息对至少一个第一候选句文本进行重要性排序;
第二确定子单元,用于将重要性排序在前的预设数量个第一候选句文本与第二候选句文本确定为目标候选句文本,并将目标候选句文本发送给输入法客户端进行推荐显示。
可选地,在一些实施例中,历史上屏信息包括历史上屏时间信息以及历史上屏次数信息,排序子单元,包括:
第一确定模块,用于根据历史上屏时间确定每一第一候选句文本的第一重要性权重系数;
第二确定模块,用于根据历史上屏次数信息确定每一第一候选句文本的第二重要性权重系数;
排序模块,用于基于第一重要性权重系数和第二重要性权重系数对至少一个第一候选句文本进行重要性排序。
可选地,在一些实施例中,第二确定子单元,包括:
去重模块,用于将重要性排序在前的预设数量个第一候选句文本与第二候选句文本组成的句文本集合进行去重;
第三确定模块,用于根据去重后得到的多个候选句文本确定目标候选句文本。
可选地,本公开中目标候选文本的推荐显示具体可以由推荐显示单元实现,推荐显示单元,包括:
第一显示子单元,用于显示输入法客户端的文本输入界面,文本输入界面包括输入字符串显示区和推荐文本显示区;
第二显示子单元,用于在推荐文本显示区显示目标候选句文本。
可选地,推荐显示单元,还包括:
第三显示子单元,用于响应于接收到的字符串输入操作,在输入字符串显示区显示输入的目标字符串,在推荐文本显示区显示多个推荐候选词;
第三确定子单元,用于响应于接收到的候选词选取操作,基于候选词选取操作在多个推荐候选词中确定目标候选词;
第四确定子单元,用于响应于接收到的推荐候选内容切换指令,基于目标候选词确定目标候选句文本。
可选地,在一些实施例中,推荐显示单元,还包括:
第四显示子单元,用于响应于对推荐文本显示区显示的文本的选择上屏操作,将被选中的文本在目标应用的文本显示区域进行上屏显示,选中的文本为候选词或候选句;
第五显示子单元,用于在输入法客户端的文本输入界面显示至少一个候选推荐文本,候选推荐文本为根据目标应用的上下文信息、选中的文本以及目标应用的应用程序信息生成的句文本。
可选地,在一些实施例中,第一确定单元,包括:
第三获取子单元,用于获取目标候选词对应的索引信息;
查找子单元,用于基于索引信息在预设句库中进行查找,得到至少一个第一候选句文本。
参照图11,图11为实现本公开实施例的输入文本推荐方法的终端140的部分的结构框图,该终端140包括:射频(Radio Frequency,简称RF)电路1110、存储器1115、输入单元1130、显示单元1140、传感器1150、音频电路1160、无线保真(wireless fidelity,简称WiFi)模块1170、处理器1180、以及电源1190等部件。本领域技术人员可以理解,图11示出的终端140结构并不构成对手机或电脑的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
RF电路1110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1180处理;另外,将设计上行的数据发送给基站。
存储器1115可用于存储软件程序以及模块,处理器1180通过运行存储在存储器1115的软件程序以及模块,从而执行终端的各种功能应用以及输入文本推荐。
输入单元1130可用于接收输入的数字或字符信息,以及产生与终端的设置以及功能控制有关的键信号输入。具体地,输入单元1130可包括触控面板1131以及其他输入装置1132。
显示单元1140可用于显示输入的信息或提供的信息以及终端的各种菜单。显示单元1140可包括显示面板1141。
音频电路1160、扬声器1161,传声器1162可提供音频接口。
在本实施例中,当终端140可以作为接入层设备时,所包括的处理器1180可以执行前面实施例的输入文本推荐方法。
本公开实施例的终端140包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
图12为实施本公开实施例的输入文本推荐方法的接入服务器120的部分的结构框图。接入服务器120可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,简称CPU)1222(例如,一个或一个以上处理器)和存储装置1232,一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储装置)。其中,存储装置1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器110中的一系列指令操作。更进一步地,中央处理器1222可以设置为与存储介质1230通信,在接入服务器120上执行存储介质1230中的一系列指令操作。
接入服务器120还可以包括一个或一个以上电源1226,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1258,和/或,一个或一个以上操作系统1241,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
接入服务器120中的中央处理器1222可以用于执行本公开实施例的输入文本推荐方法。
本公开实施例还提供一种存储介质,存储介质用于存储程序代码,程序代码用于执行前述各个实施例的输入文本推荐方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序。计算机设备的处理器读取该计算机程序并执行,使得该计算机设备执行实现上述的输入文本推荐方法。
本公开的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“包含”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或装置不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或装置固有的其它步骤或单元。
应当理解,在本公开中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
应了解,在本公开实施例的描述中,多个(或多项)的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。
在本公开所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行本公开各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
还应了解,本公开实施例提供的各种实施方式可以任意进行组合,以实现不同的技术效果。
以上是对本公开的实施方式的具体说明,但本公开并不局限于上述实施方式,熟悉本领域的技术人员在不违背本公开精神的条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本公开权利要求所限定的范围内。

Claims (18)

1.一种输入文本推荐方法,其特征在于,所述方法包括:
根据输入法客户端接收到的输入信息确定目标候选词;
基于所述目标候选词在预设句库中确定至少一个第一候选句文本;
获取所述输入法客户端的输入环境信息以及历史上屏文本,所述历史上屏文本为所述输入法客户端展示的候选文本中被选中并上屏显示的词或句;
将所述目标候选词、所述输入环境信息以及所述历史上屏文本发送给大语言模型进行内容生成,并接收所述大语言模型返回的第二候选句文本;
在所述至少一个第一候选句文本与所述第二候选句文本中确定目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标候选词、所述输入环境信息以及所述历史上屏文本发送给大语言模型进行内容生成,并接收所述大语言模型返回的第二候选句文本,包括:
将所述目标候选词、所述输入环境信息以及所述历史上屏文本分多个轮次发送给大语言模型进行多轮内容生成;
根据所述大语言模型最后一轮输出的生成内容确定第二候选句文本。
3.根据权利要求2所述的方法,其特征在于,所述将所述目标候选词、所述输入环境信息以及所述历史上屏文本分多个轮次发送给大语言模型进行多轮内容生成,包括:
将所述目标候选词与所述输入环境信息发送给大语言模型进行内容生成,并接收所述大语言模型输出的第一中间生成内容;
将所述历史上屏文本发送给所述大语言模型进行内容生成,并接收所述大语言模型输出的第二中间生成内容;
获取所述目标候选词的领域信息对应的领域词,并将所述领域词发送给所述大语言模型进行内容生成;
所述根据所述大语言模型最后一轮输出的生成内容确定第二候选句文本,包括:
根据第三轮内容生成得到的生成内容确定第二候选句文本。
4.根据权利要求3所述的方法,其特征在于,所述将所述目标候选词与所述输入环境信息发送给大语言模型进行内容生成,并接收所述大语言模型输出的第一中间生成内容,包括:
根据所述输入环境信息确定生成内容的篇幅信息和表达方式信息;
将所述目标候选词、所述篇幅信息以及所述表达方式信息发送给大语言模型进行内容生成,并接收所述大语言模型输出的第一中间生成内容。
5.根据权利要求3所述的方法,其特征在于,所述获取所述目标候选词的领域信息对应的领域词,包括:
将所述目标候选词发送给目标服务器进行领域词分析;
接收所述目标服务器返回的领域词。
6.根据权利要求1所述的方法,其特征在于,所述在所述至少一个第一候选句文本与所述第二候选句文本中确定目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示之后,还包括:
获取所述目标候选句文本中被选择上屏的目标句文本;
根据所述目标句文本更新所述预设句库。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标句文本更新所述预设句库,包括:
建立所述目标候选词与所述目标句文本之间的映射关系;
基于所述映射关系对所述预设句库中所述目标候选词对应的句文本进行更新。
8.根据权利要求1所述的方法,其特征在于,所述在所述至少一个第一候选句文本与所述第二候选句文本中确定目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示,包括:
获取每一第一候选句文本的历史上屏信息;
根据所述历史上屏信息对所述至少一个第一候选句文本进行重要性排序;
将重要性排序在前的预设数量个第一候选句文本与所述第二候选句文本确定为目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示。
9.根据权利要求8所述的方法,其特征在于,所述历史上屏信息包括历史上屏时间信息以及历史上屏次数信息,所述根据所述历史上屏信息对所述至少一个第一候选句文本进行重要性排序,包括:
根据所述历史上屏时间确定每一第一候选句文本的第一重要性权重系数;
根据所述历史上屏次数信息确定每一第一候选句文本的第二重要性权重系数;
基于所述第一重要性权重系数和所述第二重要性权重系数对所述至少一个第一候选句文本进行重要性排序。
10.根据权利要求8所述的方法,其特征在于,所述将重要性排序在前的预设数量个第一候选句文本与所述第二候选句文本确定为目标候选句文本,包括:
将重要性排序在前的预设数量个第一候选句文本与所述第二候选句文本组成的句文本集合进行去重;
根据去重后得到的多个候选句文本确定目标候选句文本。
11.根据权利要求1所述的方法,其特征在于,所述输入法客户端对所述目标候选句文本进行推荐显示,包括如下步骤:
显示所述输入法客户端的文本输入界面,所述文本输入界面包括输入字符串显示区和推荐文本显示区;
在所述推荐文本显示区显示所述目标候选句文本。
12.根据权利要求11所述的方法,其特征在于,所述在所述推荐文本显示区显示所述目标候选句文本之前,还包括:
响应于接收到的字符串输入操作,在所述输入字符串显示区显示输入的目标字符串,在所述推荐文本显示区显示多个推荐候选词;
响应于接收到的候选词选取操作,基于所述候选词选取操作在所述多个推荐候选词中确定目标候选词;
响应于接收到的推荐候选内容切换指令,基于所述目标候选词确定目标候选句文本。
13.根据权利要求11所述的方法,其特征在于,所述在所述推荐文本显示区显示所述目标候选句文本之后,还包括:
响应于对所述推荐文本显示区显示的文本的选择上屏操作,将被选中的文本在目标应用的文本显示区域进行上屏显示,所述选中的文本为候选词或候选句;
在所述输入法客户端的文本输入界面显示至少一个候选推荐文本,所述候选推荐文本为根据所述目标应用的上下文信息、所述选中的文本以及所述目标应用的应用程序信息生成的句文本。
14.根据权利要求1所述的方法,其特征在于,所述基于所述目标候选词在预设句库中确定至少一个第一候选句文本,包括:
获取所述目标候选词对应的索引信息;
基于所述索引信息在所述预设句库中进行查找,得到至少一个第一候选句文本。
15.一种输入文本推荐装置,其特征在于,所述装置包括:
第一确定单元,用于根据输入法客户端接收到的输入信息确定目标候选词;
第二确定单元,用于基于所述目标候选词在预设句库中确定至少一个第一候选句文本;
获取单元,用于获取所述输入法客户端的输入环境信息以及历史上屏文本,所述历史上屏文本为所述输入法客户端展示的候选文本中被选中并上屏显示的词或句;
发送单元,用于将所述目标候选词、所述输入环境信息以及所述历史上屏文本发送给大语言模型进行内容生成,并接收所述大语言模型返回的第二候选句文本;
第三确定单元,用于在所述至少一个第一候选句文本与所述第二候选句文本中确定目标候选句文本,并将所述目标候选句文本发送给所述输入法客户端进行推荐显示。
16.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1至14任意一项所述的输入文本推荐方法。
17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现根据权利要求1至14任意一项所述的输入文本推荐方法。
18.一种计算机程序产品,该计算机程序产品包括计算机程序,所述计算机程序被计算机设备的处理器读取并执行,使得该计算机设备执行根据权利要求1至14任意一项所述的输入文本推荐方法。
CN202311427287.1A 2023-10-31 2023-10-31 输入文本推荐方法、装置、存储介质及计算机设备 Pending CN117369653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311427287.1A CN117369653A (zh) 2023-10-31 2023-10-31 输入文本推荐方法、装置、存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311427287.1A CN117369653A (zh) 2023-10-31 2023-10-31 输入文本推荐方法、装置、存储介质及计算机设备

Publications (1)

Publication Number Publication Date
CN117369653A true CN117369653A (zh) 2024-01-09

Family

ID=89388993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311427287.1A Pending CN117369653A (zh) 2023-10-31 2023-10-31 输入文本推荐方法、装置、存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN117369653A (zh)

Similar Documents

Publication Publication Date Title
US11397772B2 (en) Information search method, apparatus, and system
US11055354B2 (en) Omni-platform question answering system
US9767183B2 (en) Method and system for enhanced query term suggestion
US10832011B2 (en) Question answering system using multilingual information sources
CN109408622B (zh) 语句处理方法及其装置、设备和存储介质
US9336298B2 (en) Dialog-enhanced contextual search query analysis
EP3825862A2 (en) Method and apparatus of recommending information based on fused relationship network, and device and medium
US20090249198A1 (en) Techniques for input recogniton and completion
US10783885B2 (en) Image display device, method for driving the same, and computer readable recording medium
CN112507068A (zh) 文档查询方法、装置、电子设备和存储介质
EP3822814A2 (en) Human-machine interaction method and apparatus based on neural network
CN112380331A (zh) 信息推送的方法和装置
CN114840671A (zh) 对话生成方法、模型的训练方法、装置、设备及介质
CN111737559A (zh) 资源排序方法、训练排序模型的方法及对应装置
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
US20210004420A1 (en) Post-ranker for search results
CN114036322A (zh) 用于搜索系统的训练方法、电子设备和存储介质
US11308146B2 (en) Content fragments aligned to content criteria
CN114330704A (zh) 语句生成模型更新方法、装置、计算机设备和存储介质
CN111930891B (zh) 基于知识图谱的检索文本扩展方法及相关装置
CN112784156A (zh) 基于意图识别的搜索反馈方法、系统、设备及存储介质
CN111666417A (zh) 生成同义词的方法、装置、电子设备以及可读存储介质
CN111291184A (zh) 表情的推荐方法、装置、设备及存储介质
CN117369653A (zh) 输入文本推荐方法、装置、存储介质及计算机设备
CN113918796A (zh) 信息搜索方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication