CN109977390B - 一种生成文本的方法及装置 - Google Patents

一种生成文本的方法及装置 Download PDF

Info

Publication number
CN109977390B
CN109977390B CN201711449955.5A CN201711449955A CN109977390B CN 109977390 B CN109977390 B CN 109977390B CN 201711449955 A CN201711449955 A CN 201711449955A CN 109977390 B CN109977390 B CN 109977390B
Authority
CN
China
Prior art keywords
text
word
user
words
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711449955.5A
Other languages
English (en)
Other versions
CN109977390A (zh
Inventor
李利平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201711449955.5A priority Critical patent/CN109977390B/zh
Publication of CN109977390A publication Critical patent/CN109977390A/zh
Application granted granted Critical
Publication of CN109977390B publication Critical patent/CN109977390B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Abstract

本发明公开了一种生成文本的方法及装置,获取能够表征该文本类型的字词匹配规则的文本模型,根据该用户的用户词库中的字词,利用该字词匹配规则生成目标文本。每个用户都有一个用户词库,每个用户的用户词库中的字词能够体现该用户的个性化。利用一个用户的用户词库中的字词,利用文本模型自动生成的目标文本,不仅能够快速的生成目标文本,并且,所生成的目标文本能够更好的体现该用户的个性化。

Description

一种生成文本的方法及装置
技术领域
本发明涉及互联网技术领域,特别是涉及一种生成文本的方法及装置。
背景技术
文本是书面语言的表现形式,从文学角度讲,文本是具有完整含义的多个句子的组合。根据表现形式的不同,文本可以被划分为多种类型,例如:诗,词,谜语,对联,以及祝福语等。
目前,用户需要某种类型的文本时,可以根据自身的文学水平,自行撰写文本;也可以根据需要,从互联上查找可供使用的现成的文本。但是,自行撰写文本耗费时间长,而且需要用户有一定的文学水平,而互联网上查找的文本又不能体现用户的个性化。因此,如何快速的生成符合用户个性化文本成为亟待解决的问题。
发明内容
本发明解决的技术问题在于提供一种生成文本的方法及装置,基于用户的用户词库中的字词,生成符合用户个性化的文本。
为此,本发明解决技术问题的技术方案是:
第一方面,为了解决上述问题,本发明实施例提供了一种生成文本的方法,所述方法包括:
获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则;
获取所述用户的用户词库;
根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述获取文本模型包括:
接收用户触发的生成目标文本的文本生成指令;
获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本包括:
获取文本关键词;
根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述获取文本关键词包括:
获取所述用户输入的字符串对应的候选串;
从所述候选串中获取所述文本关键词。
可选的,所述获取文本关键词包括:
从会话窗口中显示的会话内容中获取文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
响应于对所述会话窗口中的所述会话内容的选择操作;
获取所述选择操作选中的字词作为所述文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
对所述会话窗口中的所述会话内容进行语义分析;
根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述方法还包括:
利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,所述获取所述用户的用户词库包括:
获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
第二方面,为了解决上述问题,本发明实施例提供了一种生成文本的装置,所述装置包括:
第一获取模块,用于获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则;
第二获取模块,用于获取所述用户的用户词库;
生成模块,用于根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述第一获取模块包括:
接收单元,用于接收用户触发的生成目标文本的文本生成指令;
第一获取单元,用于获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述生成模块包括:
第二获取单元,用于获取文本关键词;
生成单元,用于根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述第二获取单元包括:
第一获取子单元,用于获取所述用户输入的字符串对应的候选串;
第二获取子单元,用于从所述候选串中获取所述文本关键词。
可选的,所述第二获取单元包括:
第三获取子单元,用于从会话窗口中显示的会话内容中获取文本关键词。
可选的,
所述第三获取子单元,具体用于响应于对所述会话窗口中的所述会话内容的选择操作;获取所述选择操作选中的字词作为所述文本关键词。
可选的,
所述第三获取子单元,具体用于对所述会话窗口中的所述会话内容进行语义分析;根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述装置还包括:
显示单元,用于利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,
所述第二获取模块,具体用于获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
第三方面,为了解决上述问题,本发明实施例提供了一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则;
获取所述用户的用户词库;
根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述获取文本模型包括:
接收用户触发的生成目标文本的文本生成指令;
获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本包括:
获取文本关键词;
根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述获取文本关键词包括:
获取所述用户输入的字符串对应的候选串;
从所述候选串中获取所述文本关键词。
可选的,所述获取文本关键词包括:
从会话窗口中显示的会话内容中获取文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
响应于对所述会话窗口中的所述会话内容的选择操作;
获取所述选择操作选中的字词作为所述文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
对所述会话窗口中的所述会话内容进行语义分析;
根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述指令还包括:
利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,所述获取所述用户的用户词库包括:
获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
第四方面,为了解决上述问题,本发明实施例提供了一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种生成文本的方法,所述方法包括:
获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则;
获取所述用户的用户词库;
根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述获取文本模型包括:
接收用户触发的生成目标文本的文本生成指令;
获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本包括:
获取文本关键词;
根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述获取文本关键词包括:
获取所述用户输入的字符串对应的候选串;
从所述候选串中获取所述文本关键词。
可选的,所述获取文本关键词包括:
从会话窗口中显示的会话内容中获取文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
响应于对所述会话窗口中的所述会话内容的选择操作;
获取所述选择操作选中的字词作为所述文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
对所述会话窗口中的所述会话内容进行语义分析;
根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述方法还包括:
利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,所述获取所述用户的用户词库包括:
获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
通过上述技术方案可知,本发明有如下有益效果:
获取能够表征该文本类型的字词匹配规则的文本模型,根据该用户的用户词库中的字词,利用该字词匹配规则生成目标文本。每个用户都有一个用户词库,每个用户的用户词库中的字词能够体现该用户的个性化。利用一个用户的用户词库中的字词,利用文本模型自动生成的目标文本,不仅能够快速的生成目标文本,并且,所生成的目标文本能够更好的体现该用户的个性化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的生成文本的方法流程图;
图2为本发明实施例提供的触发生成文本的按钮示意图;
图3为本发明实施例提供的文本类型的选择界面示意图;
图4为本发明实施例提供的文本类型的选择界面另一示意图;
图5为本发明实施例提供的触发生成文本的按钮另一示意图;
图6为本发明实施例提供的触发显示更多文本类型的按键示意图;
图7为本发明实施例提供的生成文本的方法另一实例流程图;
图8为本发明实施例提供的获取文本关键词一实例示意图;
图9为本发明实施例提供的获取文本关键词另一实例示意图;
图10为本发明实施例提供的获取文本关键词再一实例示意图;
图11为本发明实施例提供的获取文本关键词又一实例示意图;
图12为本发明实施例提供的显示目标文本一实例示意图;
图13为本发明实施例提供的显示目标文本另一实例示意图;
图14为本发明实施例提供的显示目标文本再一实例示意图;
图15为本发明实施例提供的文本生成的方法场景流程图;
图16为本发明实施例提供的一种生成文本的装置结构示意图;
图17为本发明实施例提供的生成文本的装置硬件结构示意图。
具体实施方式
为了给出快速生成个性化的文本的实现方案,本发明实施例提供了一种生成文本的方法及装置,以下结合说明书附图对本发明的实施例进行说明。
在日常生活中,若用户需要某种类型的文本时,大都根据实际需要,基于自身的文学水平,推敲字词之间的语义关联性,自行撰写文本。用户自行撰写文本的方式,一方面,自行撰写需要耗费的时间长;另一方面,由于文学水平和词汇量有限,所得的文本语义单薄,可用性差。然而,若是用户通过互联网查找其他人撰写的现成的文本,一方面,所查找到的文本不一定能满足用户的实际需求;另一方面,所查找到的文本也不能体现用户的个性化。
例如:若文本类型是藏头诗,该藏头诗的每一句诗中第一个字连起来,能够表达用户所表达的一个完整的涵义。用户自行撰写该藏头诗,虽然能够确定该藏头诗中每一句诗的第一个字,但是,所耗费的时间较长,所得的藏头诗不一定满足押韵,词义对仗等要求。若用户从互联网上查找其他人撰写的现成的藏头诗,虽然该藏头诗能够押韵,并且词义对仗工整,但是,该藏头诗中每一句诗的第一个字连起来,不一定能表达该用户所表达的完整的含义,个性化差。
当然,除了藏头诗以外,获得其它文本类型的文本时也存在上述问题。为了解决上述问题,本发明实施例提供了生成文本的方法及装置,获取该文本类型所采用的文本模型,利用该文本模型所表征的字词匹配规则,从用户的用户词库中获得字词生成该用户所需的目标文本。一方面,通过预先对同一文本类型的大量的文本进行大数据分析,获得该文本类型的文本中的字词匹配规则,将该字词匹配规则作为该文本类型的文本模型,该文本模型能够有效的表征该文本类型的文本的字词之间的相关关系,能够利用该文本模型自动生成该文本类型的目标文本,生成目标文本的速度快;另一方面,生成目标文本时,利用用户的用户词库中的字词,该用户词库中的字词能够体现用户的个性化,因此,所生成的目标文本也能体现用户的个性化。从而,本发明实现了快速的生成符合用户个性化需求的目标文本。
下面对本发明提供的实施例进行详细描述。
示例性方法
图1为本发明实施例提供的生成文本的方法流程图,包括:
101:获取文本模型,该文本模型用于表征文本类型的字词匹配规则。
用户在生成某种文本类型的目标文本时,需要获得该目标文本所采用的文本模型,获取该文本模型存在多种可能的实现方式。一种实现方式,直接获取系统默认的文本模型,该系统默认的文本模型可以是系统能够提供的唯一的文本模型,也可以是系统使用次数最多的文本模型,还可以是上一次生成目标文本时所采用的文本模型等,这里不进行具体限定。
另一种实现方式,接收用户触发的生成目标文本的文本生成指令,获取目标文本所属的文本类型所采用的文本模型。用户需要生成某种文本类型的目标文本时,触发一个文本生成指令,指示执行生成该目标文本的操作。用户触发该文本生成指令有多种实现方式,一种实现方式中:如图2所示,提供生成文本功能的应用提供一个显示界面,在该显示界面上设置有一个按钮,用户通过点击该按钮触发文本生成指令。另一种实现方式中,如图3所示,提供生成文本功能的应用提供一个显示界面,在该显示界面上设置多个按钮,每个按钮对应于一种文本类型,用户通过点击其中的一个按钮,实现触发该文本生成指令。
设备接收到该文本生成指令后,确定该目标文本所属的文本类型。一种实现方式中,如图2所示,显示界面上仅提供了一个按钮,用户点击该按钮触发的文本生成指令,仅用于指示设备执行生成目标文本的操作,并不提供该目标文本的文本类型。此时,如图4所示,从该显示界面跳转到另一个显示界面,另一个显示界面显示多种文本类型以供用户选择,根据用户的选择确定目标文本所属的文本类型。另一种实现方式中,如图3所示,显示界面上提供多个按钮,每个按钮对应于不同的文本类型,用户点击其中一个按钮时,所触发的文本生成指令不仅能够指示设备生成目标文本的操作,还能够指示目标文本的文本类型。
当然,还可以采用其它方式触发文本生成指令,以及确定目标文本所属的文本类型,这里不再赘述。
在一个应用场景下,提供生成文本功能的应用可以集成在输入法应用中。此时,图2所示的一个按钮,可以设置在输入法界面上进行显示,如图5所示;或者,图3所示的多个按钮,也可以设置在输入法界面上进行显示,如图6所示,还可以通过“》”按键选择显示更多的其它文本类型对应的按钮。
文本类型有很多种,例如:诗(五言绝句、七言绝句、五言律诗、七言律诗等),词(小令、中调、长调等),对联,节日祝福语(春节祝福语,中秋节祝福语,教师节祝福语,国庆节祝福语等),以及谜语等。
一种文本类型对应于一个文本模型,采用大数据分析技术,预先获得每个文本类型对应的文本模型。获得一个文本模型时,确定该文本模型对应的文本类型,获取大量的该文本类型的已有文本,采用大数据分析技术对上述大量的已有文本进行分析,获得该文本类型的字词匹配规则,该文本类型的字词匹配规则至少包括词性匹配规则以及词义匹配规则。其中,词性匹配规则用于描述该文本类型中各个位置处所采用的字词的词性。其中,词义匹配规则用于描述该文本类型中相邻字词之间的语义关联。当然,若该文本类型是诗,则该文本类型对应的文本模型还包括该文本类型的句子的个数,每个句子中字的个数,以及每个句子所采用的平仄规则等。
采用大数据分析技术对一种文本类型的已有文本进行分析,先将该已有文本进行分词,获得分词后的已有文本;然后,对分词后的已有文本进行词性分析,标注已有文本中各个词的词性;而后,采用大数据分析技术进行分析,一方面,统计各个已有文本相同位置上的词的词性,获得词性匹配规则,另一方面,创建词向量,该词向量可以表征两个词之间的相关性,即能够可以表征相邻字词之间的语义关系。可以理解的是,在大量的已有文本中,两个词相邻的次数越多,则两个词之间的词向量的长度越短,表征两个词之间的语义关系越近;最终,根据上述所得的词性匹配规则,以及词向量表征的词义匹配规则,获得该文本类型对应的文本模型中的字词匹配规则。除此以外,相应的,若该文本模型是诗的模型,还可以确定句子的个数,每个句子中字的个数,以及每个句子所采用的平仄规则等。上述内容可以采用大数据分析技术统计得到,也可以根据诗的对仗规则确定,这里不进行具体限定。
举例说明:已有文本是五言绝句《相思》,分词后为“红豆/生/南国,春来/发/几枝。愿君/多/采撷,此物/最/相思。”标注词性为:红豆(名词)/生(动词)/南国(名词),春来(名词)/发(动词)/几枝(名词)。愿君(名词)/多(介词)/采撷(动词),此物(名词)/最(介词)/相思(动词)。然后,对大量的五言绝句进行上述分词和词性标注,分析标注的词性,可以得到五言绝句中每一句诗词性的组合规则;分析词义,可以得到五言绝句中各个字词之间的语义相关性高低,从而得到五言绝句的字词匹配规则。并且,还可以通过大数据分析的得到,文本类型为五言绝句时,对应的文本模型中,该文本模型规定句子的个数为四,每个句子中包括五个字,并且,规定平仄规则包括下述四种规则:
1、(仄)仄平平仄,平平仄仄平。(平)平平仄仄,(仄)仄仄平平;
2、(仄)仄仄平平,平平仄仄平。(平)平平仄仄,(仄)仄仄平平;
3、(平)平平仄仄,(仄)仄仄平平。(仄)仄平平仄,平平仄仄平;
4、平平仄仄平,(仄)仄仄平平。(仄)仄平平仄,平平仄仄平。
其中,上述平仄规则中,括号表示平仄均可,不进行具体限定。
上述实例中,以得到五言绝句的文本模型为例进行举例说明,上述实例仅为了举例说明如何预先获得每种文本类型对应的文本模型,并不仅限于得到上述实例所述的文本模型,其它文本类型对应的文本模型获得的方式类似,这里不再一一赘述。
采用上述方法,可以获得多种文本类型所采用的文本模型。例如:五言绝句所采用的文本模型,七言绝句所采用的文本模型,词所采用的文本模型,对联,春节祝福语所采用的文本模型,中秋节祝福语所采用的文本模型,教师节祝福语所采用的文本模型,以及谜语所采用的文本模型等。
102:获取用户的用户词库。
103:根据用户词库中的字词,利用字词匹配规则生成用户的目标文本。
确定目标文本所属的文本类型后,选择该文本类型所采用的文本模型,由于该文本模型能够表征该文本类型的字词匹配规则,则获取用户的用户词库,从该用户词库中找到与该文本模型中字词匹配规则相匹配的字词,自动生成该用户的目标文本。
其中,用户的用户词库中,包括大量能够表征用户喜好和个性化的字词。在一个实例中,一个用户的用户词库,可以是用户根据实际需要自定义的词库,即用户将其常用的字词,或者喜好使用的字词,预先自行备份存储,从而得到一个用户词库。并且,用户可以自行不断更新该用户词库,新增、删除或者修改该用户词库中的字词。
在另一个实例中,获取所述用户的输入法词库作为所述用户的用户词库。即用户的用户词库,即为该用户的输入法词库,输入法词库中记录了该用户采用输入法曾经输入过的字词。可以理解的是,不同的用户,日常采用输入法输入的字词会存在一定的差异,因此,输入法词库也能够体现用户的喜好和个性化。举例说明:若用户采用输入法曾经输入一个词“案件”,则该用户的输入法词库中存在“案件”这个词;若用户采用输入法输入一个词“按键”,则该用户的输入法词库中存在“按键”这个词;再若用户采用输入法输入一个词“暗箭”,则该用户的输入法词库中存在“暗箭”这个词。
根据文本模型中的字词匹配规则,从用户的用户词库中,获得与该字词匹配规则的字词。其中,与该字词匹配规则匹配,不仅确保词性匹配,即所生成的目标文本中各位置的词性符合要求;还要确保语义匹配,即所生成的目标文本中,相邻字词之间的语义关系合理,该目标文本能够表达一个完整的含义。
本发明提供的生成文本的方法,可以自动生成目标文本,无需用户自行撰写,生成目标文本的速度快。尤其是需要很多个目标文本时,可以快速的生成多个目标文本,节省用户自行撰写目标文本的时间。并且,由于每个用户的用户词库中,所包含的字词存在差异,该用户词库中字词的差异能够体现用户的个性化,因此,从该用户的用户词库中获得字词,利用字词匹配规则生成的目标文本,能够很好的体现用户的个性化。对于不同的用户来说,即使采用同一个文本模型,所生成的目标文本也存在差异,满足用户的个性化需求。
在一个应用场景中,用户生成目标文本前,可以指定该目标文本中所包含的一个或多个关键词,如图7所示,该方法包括:
701:接收用户触发的生成目标文本的文本生成指令。
702:获取目标文本所属的文本类型所采用的文本模型,文本模型用于表征文本类型的字词匹配规则。
701和702的具体实现方式,与图2所示的201和202中具体实现方式类似,参考图2中201和202的描述,这里不再赘述。
703:获取用户的用户词库和文本关键词。
704:根据文本关键词和用户词库中的字词,利用字词匹配规则生成用户的目标文本。
图2所示的实施例中,生成目标文本时,仅从用户的用户词库中获得字词,自动生成该目标文本即可。图7所示的实施例中,生成目标文本时,用户还可以根据实际需要,指定目标文本包含的文本关键词。例如:一种应用场景下,若目标文本是节日祝福语,则该文本关键词可以是人名,所生成的节日祝福语中包括该指定的人名。再例如:另一种应用场景下,若目标文本是藏头诗,则该文本关键词可以是能够表达一个完整含义的短语,并且,该文本关键词所包含的字的个数,与藏头诗中诗句的个数相同,同时,该文本关键词中的每一个字,分别作为该藏头诗中每一句诗的第一个字。这种场景下,由用户确定所采用的文本关键词,由藏头诗的文本模型确定该文本关键词中,每一个字所处的位置。又或者在一种应用场景下,可以指定特殊含义的词作为文本关键词,以使得所生成的目标文本包含该特殊含义。
具体实现时,获取该文本关键词存在多种可能的实现方式。
在一个实例中,提供一个文本关键词的输入框,如图8所示,由用户根据实际需要,在该输入框中键入想要添加在该目标文本中的文本关键词,从而获得该文本关键词。
在另一个实例中,提供文本关键词的选项列表,如图9所示,由用户预先确定一些文本关键词,当用户需要使用时,从该文本关键词的选项列表中选,选择所需的文本关键词,从而获得该文本关键词。
在又一个实施例中,获取用户输入的字符串对应的候选串;从候选串中获得文本关键词。用户在输入法界面上输入文本关键词的字符串,输入法将该字符串转换成候选串。当仅存在一个对应于该字符串的候选串时,将该候选串作为该文本关键词。如图10所示,在输入法界面上输入字符串“duan’wu’jie”,则仅存在一个候选串“端午节”对应于该字符串,则将“端午节”作为文本关键词。若存在多个对应于该字符串的候选串时,可以响应于用户的选择,确定该文本关键词;或者,将排列在第一位的候选串作为文本关键词。如图11所示,在输入法界面上输入字符串“chun’jie”,存在多个候选串“春节”,“纯洁”,以及“春姐”等。可以响应用户对候选串“春节”的选择,将“春节”作为文本关键词;也可以默认的选择第一个候选串“春节”作为文本关键词。
这里需要说明的是,第三种获得文本关键词的实现方式中,用户仅需要在输入法界面上输入字符串,无需设置文本关键词的输入框,可以从输入法界面上直接从该字符串转换所得的候选串中,获得文本关键词,提供了一种便捷的获得文本关键词的应用场景。
在又一个实例中,从会话窗口中显示的会话内容中获取文本关键词。此方案应用于即时通信会话场景,不限于两个用户进行即时通信会话,也不限于两个用户以上的群体进行即时通信会话。在会话窗口中,显示有会话内容,该会话内容即为进行该即时通信会话的用户发送的聊天内容。可以从会话窗口中所显示的会话内容中,获取文本关键词。例如:在会话窗口中,用户在讨论荷花,可以从会话内容中获取“荷花”作为文本关键词,生成一首吟诵夏天的荷花的诗。再例如:在会话窗口中,用户在讨论中秋佳节,可以从会话内容中获取“中秋佳节”作为文本关键词,生成一首五言绝句。
从会话窗口中显示的会话内容中获取文本关键词的一种实现方式:响应于对会话窗口中的会话内容的选择操作;获取选择操作选中的字词作为所述文本关键词。上述实现方式中,用户从会话窗口所显示的会话内容中,选择所需的文本关键词。设备响应于用户的选择操作,识别用户从会话内容中所选的文本关键词,获取该文本关键词。例如:会话窗口中显示的会话内容包括“荷花很美,以此为主题作一首诗怎么样?”用户从该会话内容中选择了“荷花”,则设备响应于用户的选择操作,将“荷花”作为文本关键词。
从会话窗口中显示的会话内容中获取文本关键词的另一种实现方式:对会话窗口中的会话内容进行语义分析;根据语义分析结果,从会话内容中提取文本关键词。上述实现方式中,采用语义分析算法,对会话窗口中的会话内容进行语义分析,获得文本内容中与该目标文本存在语义依存关系的文本关键词。例如:会话窗口中显示的会话内容包括“荷花很美,以此为主题作一首诗怎么样?”诗作为目标文本的一种体现形式,通过语义分析,可以分析得到与“诗”语义依存关系最近的是“主题”,而与“主题”语义依存关系最近的是“荷花”,提取文本关键词“荷花”。
在后续生成目标文本时,除了获得的文本关键词以外,其它的字词从用户的用户词库中获得。从而,根据该文本关键词,以及从用户的用户词库中获得的字词,利用该文本模型中的字词匹配规则,生成目标文本,所生成的目标文本中包括该文本关键词。
这里需要说明的是,获取文本关键词,可以是用户根据需要,主动提供生成目标文本的文本关键词,例如:在生成的节日祝福语中,主动提供人名作为该节日祝福语的文本关键词;还可以是根据目标文本所采用的文本模型,提示用户提供文本关键词,例如:在生成藏头诗时,获取藏头诗对应的文本模型后,该文本模型提示用户提供该藏头诗的每句诗的第一个字;又或者在生成谜语时,获取谜语对应的文本模型后,该文本模型提示用户提供谜面。
图7所示的生成文本的方法,除了从用户的用户词库中获得字词以外,还需要获得文本关键词,该文本关键词可以根据用户的需要,采用多种方式自行设定,在目标文本中加入用户自定义的文本关键词,以使得所生成的目标文本更符合用户的个性化需求。
生成目标文本后,需要将所生成的目标文本显示给用户。在一个实例中,可以提供一个显示界面,将该目标文本在该显示界面上进行显示。如图12所示。
在另一个实例中,在输入法界面上显示目标文本,显示方式为:在所述目标文本所包含的所述文本关键词对应的显示区域显示所述目标文本。
在上述内容所描述的第三种获取文本关键词的实现方式中,该文本关键词,是用户在输入法上输入的字符串,转换后所得的候选串。根据该文本关键词和用户的用户词库生成的目标文本中,包含该文本关键词,即包含该字符串对应的候选串。显示该目标文本时,无需采用额外的显示界面,在输入法界面上,该目标文本包括的候选串对应的显示区域中显示该目标文本即可。
利用该目标文本替换该目标文本包括的候选串,即在输入法界面上显示该目标文本即可。
可以理解的是,当候选串只有一个时,将该候选串作为文本关键词,所生成的目标文本也只有一个,获取该文本关键词对应的显示区域,显示该目标文本。例如:显示区域为该候选串在输入法界面上所处的位置,利用该目标文本替换该候选串,在输入法界面上显示该目标文本。如图13所示。
当候选串有多个时,若将每个候选串分别作为文本关键词,生成多个目标文本,分别获取每个文本关键词对应的显示区域,显示包含该文本关键词的目标文本。例如:显示区域为该候选串在输入法界面上所处的位置,利用所生成的目标文本,替换该目标文本所包含的候选串,在输入法界面上显示所生成的多个目标文本。如图14所示。
上述显示目标文本的方法,无需额外的设置目标文本的显示界面,并在输入法界面上,给使用输入法的用户提供生成目标文本的功能,并在该输入法界面上显示所生成的目标文本。不仅在生成目标文本时,方便的使用用户的输入法词库,生成更具有个性化的目标文本,并且,无需在额外设置的输入框中输入文本关键词,能够在输入字符串后,立即给用户显示所生成的目标文本,将输入法功能与生成文本的功能集成在一起,在确保个性化的前提下,进一步提高生成目标文本的速度,提高用户体验。
在上述内容所描述的第四种获取文本关键词的实现方式中,该文本关键词,是在会话窗口中显示的会话内容中提取的。所生成的目标文本中,包含从文本内容中提取的文本关键词。显示该目标文本时,获取该文本关键词对应的显示区域,例如:在会话窗口中,显示区域为该文本关键词上面空白位置处,或者该文本关键词下面的空白位置处,无需采用额外的显示界面,在关键词周围的空白位置处显示该目标文本,即在会话窗口中显示该目标文本即可。
下面给出一个场景实例,对本发明提供的生成文本的方法进行更直观的说明。如图15所示,该方法包括:
1501:用户点击输入法界面上设置的“生成文本”的按钮,触发生成目标文本的文本生成指令。
1502:输入法界面显示多种文本类型的选择按钮。
1503:用户点击“藏头诗”的选择按钮。
1504:输入法界面提示用户输入“藏头诗”的文本关键词。
1505:用户在输入法界面上输入字符串“sou’gou’shu’ru’fa’hen’hao’yong”。
1506:输入法处理系统获取字符串“sou’gou’shu’ru’fa’hen’hao’yong”对应的候选串“搜狗输入法很好用”作为文本关键词。
1507:输入法处理系统根据文本关键词“搜狗输入法很好用”,该用户的输入法词库,以及“藏头诗”所采用的文本模型生成该用户的目标文本。
1508:输入法界面利用目标文本替换候选串“搜狗输入法很好用”进行显示。
在图15所述的实例中,输入法处理系统中集成了生成文本的功能,在用户触发了生成目标文本的文本生成指令后,利用用户的输入法词库,以及目标文本所属的文本类型所采用的文本模型,自动生成该用户的目标文本,生成目标文本的速度快,并且,所生成的目标文本能够更好的体现用户的个性化。生成该目标文本时,在输入法界面上输入字符串即可获得文本关键词,无需设置额外的文本关键词的输入框,也无需对该文本关键词进行上屏操作,简化用户的操作步骤,提供更便捷快速的显示所生成的目标文本的方式。
示例性装置
图16为本发明实施例提供的一种生成文本的装置结构示意图,包括:
第一获取模块1601,用于获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则。
第二获取模块1602,用于获取所述用户的用户词库。
生成模块1603,用于根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述第一获取模块包括:
接收单元,用于接收用户触发的生成目标文本的文本生成指令;
第一获取单元,用于获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述生成模块包括:
第二获取单元,用于获取文本关键词;
生成单元,用于根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述第二获取单元包括:
第一获取子单元,用于获取所述用户输入的字符串对应的候选串;
第二获取子单元,用于从所述候选串中获取所述文本关键词。
可选的,所述第二获取单元包括:
第三获取子单元,用于从会话窗口中显示的会话内容中获取文本关键词。
可选的,
所述第三获取子单元,具体用于响应于对所述会话窗口中的所述会话内容的选择操作;获取所述选择操作选中的字词作为所述文本关键词。
可选的,
所述第三获取子单元,具体用于对所述会话窗口中的所述会话内容进行语义分析;根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述装置还包括:
显示单元,用于利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,
所述第二获取模块,具体用于获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
上述内容所述的装置是上式内容所述的示例性方法所对应的装置,具体实现方式与示例性方法类似,参考示例性方法中的描述,这里不再赘述。
上述内容所提供的装置,获取能够表征该文本类型的字词匹配规则的文本模型,根据该用户的用户词库中的字词,利用该字词匹配规则生成目标文本。每个用户都有一个用户词库,每个用户的用户词库中的字词能够体现该用户的个性化。利用一个用户的用户词库中的字词,利用文本模型自动生成的目标文本,不仅能够快速的生成目标文本,并且,所生成的目标文本能够更好的体现该用户的个性化。
参照图17,装置1700可以包括以下一个或多个组件:处理组件1702,存储器1704,电源组件1706,多媒体组件1708,音频组件1710,输入/输出(I/O)的接口1712,传感器组件1714,以及通信组件1716。
处理组件1702通常控制装置1700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1702可以包括一个或多个处理器1720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1702可以包括一个或多个模块,便于处理组件1702和其他组件之间的交互。例如,处理部件1702可以包括多媒体模块,以方便多媒体组件1708和处理组件1702之间的交互。
存储器1704被配置为存储各种类型的数据以支持在设备1700的操作。这些数据的示例包括用于在装置1700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1706为装置1700的各种组件提供电力。电源组件1706可以包括电源管理系统,一个或多个电源,及其他与为装置1700生成、管理和分配电力相关联的组件。
多媒体组件1708包括在所述装置1700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还确认与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1708包括一个前置摄像头和/或后置摄像头。当设备1700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1710被配置为输出和/或输入音频信号。例如,音频组件1710包括一个麦克风(MIC),当装置1700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1704或经由通信组件1716发送。在一些实施例中,音频组件1710还包括一个扬声器,用于输出音频信号。
I/O接口1712为处理组件1702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1714包括一个或多个传感器,用于为装置1700提供各个方面的状态评估。例如传感器组件1714可以确认到设备1700的打开/关闭状态,组件的相对定位,例如所述组件为装置1700的显示器和小键盘,传感器组件1714还可以确认装置1700或装置1700一个组件的位置改变,用户与装置1700接触的存在或不存在,装置1700方位或加速/减速和装置1700的温度变化。传感器组件1714可以包括接近传感器,被配置用来在没有任何的物理接触时确认附近物体的存在。传感器组件1714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1716被配置为便于装置1700和其他设备之间有线或无线方式的通信。装置1700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
具体地,本发明实施例提供了一种电子设备,该设备可以具体为装置1700,包括有存储器1704,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器1704中,且经配置以由一个或者一个以上处理器1720执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则;
获取所述用户的用户词库;
根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述获取文本模型包括:
接收用户触发的生成目标文本的文本生成指令;
获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本包括:
获取文本关键词;
根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述获取文本关键词包括:
获取所述用户输入的字符串对应的候选串;
从所述候选串中获取所述文本关键词。
可选的,所述获取文本关键词包括:
从会话窗口中显示的会话内容中获取文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
响应于对所述会话窗口中的所述会话内容的选择操作;
获取所述选择操作选中的字词作为所述文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
对所述会话窗口中的所述会话内容进行语义分析;
根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述指令还包括:
利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,所述获取所述用户的用户词库包括:
获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
本发明实施例还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1704,上述指令可由装置1700的处理器1720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种生成文本的方法,所述方法包括:
获取文本模型,所述文本模型用于表征所述文本类型的字词匹配规则;
获取所述用户的用户词库;
根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本。
可选的,所述获取文本模型包括:
接收用户触发的生成目标文本的文本生成指令;
获取所述目标文本所属的文本类型所采用的文本模型。
可选的,所述根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本包括:
获取文本关键词;
根据所述文本关键词和所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本,所述目标文本包括所述文本关键词。
可选的,所述获取文本关键词包括:
获取所述用户输入的字符串对应的候选串;
从所述候选串中获取所述文本关键词。
可选的,所述获取文本关键词包括:
从会话窗口中显示的会话内容中获取文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
响应于对所述会话窗口中的所述会话内容的选择操作;
获取所述选择操作选中的字词作为所述文本关键词。
可选的,所述从会话窗口中显示的会话内容中获取文本关键词包括:
对所述会话窗口中的所述会话内容进行语义分析;
根据语义分析结果,从所述会话内容中提取所述文本关键词。
可选的,所述方法还包括:
利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
可选的,所述获取所述用户的用户词库包括:
获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种生成文本的方法,其特征在于,所述方法包括:
获取目标文本所采用的文本模型,所述文本模型用于表征文本类型的字词匹配规则,所述文本类型包括诗、词、对联、节日祝福语或者谜语,所述字词匹配规则至少包括词性匹配规则以及词义匹配规则,所述词性匹配规则用于描述文本类型中各个位置处所采用的字词的词性,所述词义匹配规则用于描述文本类型中相邻字词之间的语义关系,所述文本模型包括文本类型的句子的个数、每个句子中字的个数以及每个句子所采用的平仄规则;
获取用户的用户词库;
获取文本关键词;
基于所述文本模型,根据利用文本模型中的字词匹配规则从用户的所述用户词库中获得与所述字词匹配规则的字词以及所述文本关键词,生成所述用户的目标文本,所述目标文本包括所述文本关键词,其中,所述目标文本为藏头诗时,所述文本关键词为表达一个完整含义的短语,所述文本关键词所包含的字的个数与藏头诗中诗句的个数相同,所述文本关键词中的每一个字分别作为藏头诗中每一句诗的第一个字;
其中,所述字词匹配规则的生成方式包括:
采用大数据分析技术对一种文本类型的已有文本进行分词,获得分词后的已有文本;
对分词后的已有文本进行词性分析,标注已有文本中各个词的词性;
采用大数据分析技术进行分析,统计各个已有文本相同位置上的词的词性,获得词性匹配规则,并创建词向量,所述词向量表征两个词之间的相关性以及表征相邻字词之间的语义关系,两个词相邻的次数越多,则两个词之间的词向量的长度越短,表征两个词之间的语义关系越近;
根据所述词性匹配规则,以及词向量表征的词义匹配规则,获得该文本类型对应的文本模型中的字词匹配规则。
2.根据权利要求1所述的方法,其特征在于,所述获取目标文本所采用的文本模型包括:
接收用户触发的生成目标文本的文本生成指令;
获取所述目标文本所属的文本类型所采用的文本模型。
3.根据权利要求1所述的方法,其特征在于,所述获取文本关键词包括:
获取所述用户输入的字符串对应的候选串;
从所述候选串中获取所述文本关键词。
4.根据权利要求1所述的方法,其特征在于,所述获取文本关键词包括:
从会话窗口中显示的会话内容中获取文本关键词。
5.根据权利要求4所述的方法,其特征在于,所述从会话窗口中显示的会话内容中获取文本关键词包括:
响应于对所述会话窗口中的所述会话内容的选择操作;
获取所述选择操作选中的字词作为所述文本关键词。
6.根据权利要求4所述的方法,其特征在于,所述从会话窗口中显示的会话内容中获取文本关键词包括:
对所述会话窗口中的所述会话内容进行语义分析;
根据语义分析结果,从所述会话内容中提取所述文本关键词。
7.根据权利要求4-6任意一项所述的方法,其特征在于,所述方法还包括:
在所述目标文本所包含的所述文本关键词对应的显示区域显示所述目标文本。
8.根据权利要求1-6任意一项所述的方法,其特征在于,所述获取用户的用户词库包括:
获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
9.一种生成文本的装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标文本所采用的文本模型,所述文本模型用于表征文本类型的字词匹配规则,所述文本类型包括诗、词、对联、节日祝福语或者谜语,所述字词匹配规则至少包括词性匹配规则以及词义匹配规则,所述词性匹配规则用于描述文本类型中各个位置处所采用的字词的词性,所述词义匹配规则用于描述文本类型中相邻字词之间的语义关系,所述文本模型包括文本类型的句子的个数、每个句子中字的个数以及每个句子所采用的平仄规则;
第二获取模块,用于获取用户的用户词库;
生成模块,用于根据所述用户词库中的字词,利用所述字词匹配规则生成所述用户的所述目标文本;
所述生成模块包括:
第二获取单元,用于获取文本关键词;
生成单元,用于基于所述文本模型,根据利用文本模型中的字词匹配规则从用户的所述用户词库中获得与所述字词匹配规则的字词以及所述文本关键词,生成所述用户的目标文本,所述目标文本包括所述文本关键词,其中,所述目标文本为藏头诗时,所述文本关键词为表达一个完整含义的短语,所述文本关键词所包含的字的个数与藏头诗中诗句的个数相同,所述文本关键词中的每一个字分别作为藏头诗中每一句诗的第一个字;
其中,所述字词匹配规则的生成方式包括:
采用大数据分析技术对一种文本类型的已有文本进行分词,获得分词后的已有文本;
对分词后的已有文本进行词性分析,标注已有文本中各个词的词性;
采用大数据分析技术进行分析,统计各个已有文本相同位置上的词的词性,获得词性匹配规则,并创建词向量,所述词向量表征两个词之间的相关性以及表征相邻字词之间的语义关系,两个词相邻的次数越多,则两个词之间的词向量的长度越短,表征两个词之间的语义关系越近;
根据所述词性匹配规则,以及词向量表征的词义匹配规则,获得该文本类型对应的文本模型中的字词匹配规则。
10.根据权利要求9所述的装置,其特征在于,所述第一获取模块包括:
接收单元,用于接收用户触发的生成目标文本的文本生成指令;
第一获取单元,用于获取所述目标文本所属的文本类型所采用的文本模型。
11.根据权利要求9所述的装置,其特征在于,所述第二获取单元包括:
第一获取子单元,用于获取所述用户输入的字符串对应的候选串;
第二获取子单元,用于从所述候选串中获取所述文本关键词。
12.根据权利要求9所述的装置,其特征在于,所述第二获取单元包括:
第三获取子单元,用于从会话窗口中显示的会话内容中获取文本关键词。
13.根据权利要求12所述的装置,其特征在于,
所述第三获取子单元,具体用于响应于对所述会话窗口中的所述会话内容的选择操作;获取所述选择操作选中的字词作为所述文本关键词。
14.根据权利要求12所述的装置,其特征在于,
所述第三获取子单元,具体用于对所述会话窗口中的所述会话内容进行语义分析;根据语义分析结果,从所述会话内容中提取所述文本关键词。
15.根据权利要求12-14任意一项所述的装置,其特征在于,所述装置还包括:
显示单元,用于利用所述目标文本替换所述目标文本所包含的所述文本关键词进行显示。
16.根据权利要求9-14任意一项所述的装置,其特征在于,
所述第二获取模块,具体用于获取所述用户的输入法词库作为所述用户的用户词库,所述输入法词库包括输入法所备份的所述用户曾输入的字词。
17.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取目标文本所采用的文本模型,所述文本模型用于表征文本类型的字词匹配规则,所述文本类型包括诗、词、对联、节日祝福语或者谜语,所述字词匹配规则至少包括词性匹配规则以及词义匹配规则,所述词性匹配规则用于描述文本类型中各个位置处所采用的字词的词性,所述词义匹配规则用于描述文本类型中相邻字词之间的语义关系,所述文本模型包括文本类型的句子的个数、每个句子中字的个数以及每个句子所采用的平仄规则;
获取用户的用户词库;
获取文本关键词;
基于所述文本模型,根据利用文本模型中的字词匹配规则从用户的所述用户词库中获得与所述字词匹配规则的字词以及所述文本关键词,生成所述用户的目标文本,所述目标文本包括所述文本关键词,其中,所述目标文本为藏头诗时,所述文本关键词为表达一个完整含义的短语,所述文本关键词所包含的字的个数与藏头诗中诗句的个数相同,所述文本关键词中的每一个字分别作为藏头诗中每一句诗的第一个字;
其中,所述字词匹配规则的生成方式包括:
采用大数据分析技术对一种文本类型的已有文本进行分词,获得分词后的已有文本;
对分词后的已有文本进行词性分析,标注已有文本中各个词的词性;
采用大数据分析技术进行分析,统计各个已有文本相同位置上的词的词性,获得词性匹配规则,并创建词向量,所述词向量表征两个词之间的相关性以及表征相邻字词之间的语义关系,两个词相邻的次数越多,则两个词之间的词向量的长度越短,表征两个词之间的语义关系越近;
根据所述词性匹配规则,以及词向量表征的词义匹配规则,获得该文本类型对应的文本模型中的字词匹配规则。
18.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种生成文本的方法,所述方法包括:
获取目标文本所采用的文本模型,所述文本模型用于表征文本类型的字词匹配规则,所述文本类型包括诗、词、对联、节日祝福语或者谜语,所述字词匹配规则至少包括词性匹配规则以及词义匹配规则,所述词性匹配规则用于描述文本类型中各个位置处所采用的字词的词性,所述词义匹配规则用于描述文本类型中相邻字词之间的语义关系,所述文本模型包括文本类型的句子的个数、每个句子中字的个数以及每个句子所采用的平仄规则;
获取用户的用户词库;
获取文本关键词;
基于所述文本模型,根据利用文本模型中的字词匹配规则从用户的所述用户词库中获得与所述字词匹配规则的字词以及所述文本关键词,生成所述用户的目标文本,所述目标文本包括所述文本关键词,其中,所述目标文本为藏头诗时,所述文本关键词为表达一个完整含义的短语,所述文本关键词所包含的字的个数与藏头诗中诗句的个数相同,所述文本关键词中的每一个字分别作为藏头诗中每一句诗的第一个字;
其中,所述字词匹配规则的生成方式包括:
采用大数据分析技术对一种文本类型的已有文本进行分词,获得分词后的已有文本;
对分词后的已有文本进行词性分析,标注已有文本中各个词的词性;
采用大数据分析技术进行分析,统计各个已有文本相同位置上的词的词性,获得词性匹配规则,并创建词向量,所述词向量表征两个词之间的相关性以及表征相邻字词之间的语义关系,两个词相邻的次数越多,则两个词之间的词向量的长度越短,表征两个词之间的语义关系越近;
根据所述词性匹配规则,以及词向量表征的词义匹配规则,获得该文本类型对应的文本模型中的字词匹配规则。
CN201711449955.5A 2017-12-27 2017-12-27 一种生成文本的方法及装置 Active CN109977390B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711449955.5A CN109977390B (zh) 2017-12-27 2017-12-27 一种生成文本的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711449955.5A CN109977390B (zh) 2017-12-27 2017-12-27 一种生成文本的方法及装置

Publications (2)

Publication Number Publication Date
CN109977390A CN109977390A (zh) 2019-07-05
CN109977390B true CN109977390B (zh) 2023-11-03

Family

ID=67071824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711449955.5A Active CN109977390B (zh) 2017-12-27 2017-12-27 一种生成文本的方法及装置

Country Status (1)

Country Link
CN (1) CN109977390B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609991B (zh) * 2019-09-10 2023-09-19 卓尔智联(武汉)研究院有限公司 文本生成方法、电子装置及存储介质
CN112052649A (zh) * 2020-10-12 2020-12-08 腾讯科技(深圳)有限公司 文本生成方法、装置、电子设备及存储介质
CN113360001A (zh) * 2021-05-26 2021-09-07 北京百度网讯科技有限公司 输入文本的处理方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820475A (zh) * 2010-05-25 2010-09-01 拓维信息系统股份有限公司 基于智能语义理解的手机彩信生成方法
CN103955454A (zh) * 2014-03-19 2014-07-30 北京百度网讯科技有限公司 一种在白话文与文言文之间进行文体转换的方法和设备
CN106095742A (zh) * 2016-06-20 2016-11-09 北京金山安全软件有限公司 一种文本内容生成方法与服务器
CN106569995A (zh) * 2016-09-26 2017-04-19 天津大学 基于语料库和格律规则的汉语古诗词自动生成方法
CN106874451A (zh) * 2017-02-13 2017-06-20 长沙军鸽软件有限公司 一种自动建立个人专属语料库的方法
CN106933789A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 旅游攻略生成方法和生成系统
CN107291680A (zh) * 2017-05-09 2017-10-24 毛姗婷 一种基于模板的自动生成作文的系统及实现方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9836448B2 (en) * 2009-04-30 2017-12-05 Conversant Wireless Licensing S.A R.L. Text editing

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820475A (zh) * 2010-05-25 2010-09-01 拓维信息系统股份有限公司 基于智能语义理解的手机彩信生成方法
CN103955454A (zh) * 2014-03-19 2014-07-30 北京百度网讯科技有限公司 一种在白话文与文言文之间进行文体转换的方法和设备
CN106933789A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 旅游攻略生成方法和生成系统
CN106095742A (zh) * 2016-06-20 2016-11-09 北京金山安全软件有限公司 一种文本内容生成方法与服务器
CN106569995A (zh) * 2016-09-26 2017-04-19 天津大学 基于语料库和格律规则的汉语古诗词自动生成方法
CN106874451A (zh) * 2017-02-13 2017-06-20 长沙军鸽软件有限公司 一种自动建立个人专属语料库的方法
CN107291680A (zh) * 2017-05-09 2017-10-24 毛姗婷 一种基于模板的自动生成作文的系统及实现方法

Also Published As

Publication number Publication date
CN109977390A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
WO2017088245A1 (zh) 参考文档的推荐方法及装置
CN107644646B (zh) 语音处理方法、装置以及用于语音处理的装置
KR101756042B1 (ko) 입력 처리 방법, 장치 및 설비
CN108829686B (zh) 翻译信息显示方法、装置、设备及存储介质
CN111128183B (zh) 语音识别方法、装置和介质
CN109977390B (zh) 一种生成文本的方法及装置
RU2733816C1 (ru) Способ обработки речевой информации, устройство и запоминающий носитель информации
CN111538830B (zh) 法条检索方法、装置、计算机设备及存储介质
CN111160047A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN111046210A (zh) 一种信息推荐方法、装置和电子设备
CN111797262A (zh) 诗词生成方法、装置、电子设备和存储介质
CN110232181B (zh) 评论分析方法及装置
CN113987128A (zh) 相关文章搜索方法、装置、电子设备和存储介质
CN113673261A (zh) 数据生成方法、装置及可读存储介质
CN111831132A (zh) 一种信息推荐方法、装置和电子设备
CN111597325B (zh) 一种文本查询方法及装置
CN109976548B (zh) 一种输入方法及输入装置
CN113589949A (zh) 一种输入方法、装置和电子设备
KR20210050484A (ko) 정보 처리 방법, 장치 및 저장 매체
CN113221030A (zh) 一种推荐方法、装置和介质
CN111178086A (zh) 数据处理方法、装置和介质
CN110765338A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN110929122A (zh) 一种数据处理方法、装置和用于数据处理的装置
US20230196001A1 (en) Sentence conversion techniques
CN110858100B (zh) 联想候选词生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant