CN109116996A - 用于获取信息的方法、装置及服务器 - Google Patents

用于获取信息的方法、装置及服务器 Download PDF

Info

Publication number
CN109116996A
CN109116996A CN201710487359.XA CN201710487359A CN109116996A CN 109116996 A CN109116996 A CN 109116996A CN 201710487359 A CN201710487359 A CN 201710487359A CN 109116996 A CN109116996 A CN 109116996A
Authority
CN
China
Prior art keywords
candidate word
phonetic
phonetic unit
information
binary crelation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710487359.XA
Other languages
English (en)
Other versions
CN109116996B (zh
Inventor
李阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710487359.XA priority Critical patent/CN109116996B/zh
Publication of CN109116996A publication Critical patent/CN109116996A/zh
Application granted granted Critical
Publication of CN109116996B publication Critical patent/CN109116996B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了用于获取信息的方法、装置及服务器。该方法的一具体实施方式包括:获取拼音信息中拼音单元对应的候选字集合,上述拼音单元用于筛选出候选字;确定相邻候选字集合之间候选字的二元关系,上述二元关系用于表征相邻候选字集合之间候选字的匹配度;根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息。该实施方式通过二元关系确定拼音单元对应的候选字,最后得到对应拼音信息的输出信息,提高了拼音信息的识别精度。

Description

用于获取信息的方法、装置及服务器
技术领域
本申请涉及数据处理技术领域,具体涉及输入法技术领域,尤其涉及用于获取信息的方法、装置及服务器。
背景技术
随着科技的发展,各种智能设备应运而生,这些智能设备通常具备很好的便携性,强大的数据处理功能和联网功能,提高了人们工作和学习的效率,成为人们工作和生活中不可或缺的组成部分。智能设备经常需要输入信息来进行相应的数据处理,输入法应用就成为了智能设备的必备应用。对于现有的大部分输入法而言,输入法的词条库决定了用户输入拼音信息时能够推荐的字、词或词组,以及这些字、词或词组的排序。此外,输入法还可以通过用户的历史输入词条来学习用户的输入习惯,对推荐的字、词或词组进行重新排序,以便快速准确地向用户提供信息。其中,拼音信息通常用于得到字、词、词组或句子等信息。
然而,现有的输入法在识别拼音信息时还存在一些不足。例如,现有的输入法通常使用一元关系来向用户提示最匹配的词条,输入法应用得到的输出信息的准确率不高。
发明内容
本申请实施例的目的在于提出用于获取信息的方法、装置及服务器,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种用于获取信息的方法,该方法包括:获取拼音信息中拼音单元对应的候选字集合,上述拼音单元用于筛选出候选字;确定相邻候选字集合之间候选字的二元关系,上述二元关系用于表征相邻候选字集合之间候选字的匹配度;根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息。
在一些实施例中,上述获取拼音信息中拼音单元对应的候选字集合包括:切分上述拼音信息得到拼音单元序列,上述拼音单元序列包括至少一个拼音单元;获取每个拼音单元对应的候选字集合。
在一些实施例中,上述确定相邻候选字集合之间候选字的二元关系包括:将第一拼音单元对应的第一候选字集合中的每个候选字,与第二拼音单元对应的第二候选字集合中的每个候选字进行二元关系匹配,得到第一候选字集合中候选字与第二候选字集合中候选字之间的二元关系序列,上述第一拼音单元与第二拼音单元相邻。
在一些实施例中,上述确定相邻候选字集合之间候选字的二元关系还包括:上述第二拼音单元在上述拼音单元序列中的位置排在第一拼音单元之后,或上述第二拼音单元在上述拼音单元序列中的位置排在第一拼音单元之前。
在一些实施例中,上述根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息包括:从上述拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息,或者,从上述拼音单元序列的最后的一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息。
在一些实施例中,上述根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息还包括:当相邻的两个拼音单元中二元关系值小于设定阈值时,删除二元关系对应的候选字。
第二方面,本申请实施例提供了一种用于获取信息的装置,上述该装置包括:候选字集合获取单元,用于获取拼音信息中拼音单元对应的候选字集合,上述拼音单元用于筛选出候选字;二元关系确定单元,用于确定相邻候选字集合之间候选字的二元关系,上述二元关系用于表征相邻候选字集合之间候选字的匹配度;输出信息确定单元,用于根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息。
在一些实施例中,上述输出信息确定单元包括:从上述拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息,或者,从上述拼音单元序列的最后的一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息。
第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于获取信息的方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于获取信息的方法。
本申请实施例提供的用于获取信息的方法、装置及服务器,通过二元关系确定拼音单元对应的候选字,最后得到对应拼音信息的输出信息,提高了拼音信息的识别精度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于获取信息的方法的一个实施例的流程图;
图3是根据本申请的用于获取信息的方法的一个应用场景的示意图;
图4是根据本申请的用于获取信息的装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于获取信息的方法或用于获取信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种信息输入应用,例如输入法应用等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上拼音信息进行查询的服务器。服务器可以对接收到的拼音信息进行处理,并将处理结果反馈给终端设备。
需要说明的是,本申请实施例所提供的用于获取信息的方法一般由终端设备101、102、103执行,相应地,用于获取信息的装置一般设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于获取信息的方法的一个实施例的流程200。该用于获取信息的方法包括以下步骤:
步骤201,获取拼音信息中拼音单元对应的候选字集合。
在本实施例中,用于获取信息的方法运行于其上的电子设备(例如图1所示的终端设备101、102、103)可以通过有线连接方式或者无线连接方式与服务器105进行数据交互。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
用户输入信息时,通常需要输入目的文字(即用户想要输入的文字)对应的拼音信息。输入法能够根据用户输入的拼音信息确定对应的候选字集合。其中,上述拼音单元用于筛选出候选字。并且,拼音单元按照在拼音信息中的位置排序。例如,拼音信息为“zhongguo”,则对应该拼音信息的拼音单元为“zhong”和“guo”。“zhong”和“guo”自动按照在拼音信息“zhongguo”中的位置关系排序。其中,拼音单元“zhong”的候选字包括:中、种、钟、重、肿、忠等;拼音单元“guo”的候选字包括:过、郭、国、果、锅、裹等。
在本实施例的一些可选的实现方式中,上述获取拼音信息中拼音单元对应的候选字集合可以包括以下步骤:
第一步,切分上述拼音信息得到拼音单元序列。
用于输入的拼音信息通常对应多个目的文字,此时,根据拼音规则将拼音信息切分为多个拼音单元。多个拼音单元之间具有先后顺序关系,得到对应的拼音单元序列。其中,上述拼音单元序列包括至少一个拼音单元。
第二步,获取每个拼音单元对应的候选字集合。
如上述的描述,每个拼音单元都对应多个候选字,这些候选字就构成了拼音单元的候选字集合。例如,拼音单元“zhong”的候选字集合可以为{中、种、钟、重、肿、忠};拼音单元“guo”的候选字集合可以为:{过、郭、国、果、锅、裹}。
步骤202,确定相邻候选字集合之间候选字的二元关系。
当用户输入的拼音信息对应多个目的文字时,目的文字之间通常不是孤立的,而是具有了关联性。这种关联性可以是相邻的两个文字之间的关联性(即二元关系),也可以是相邻的多个文字之间的关联性。通常,两个文字之间的关联性出现的概率较高,且通过二元关系确定文字的准确性较高,因此,本申请通过二元关系对相邻拼音单元包含的候选字进行二元关系匹配。其中,上述二元关系用于表征相邻候选字集合之间候选字的匹配度。例如,相邻的拼音单元为“zhong”和“guo”,对应的两个候选字集合分别为{中、种、钟、重、肿、忠}和{过、郭、国、果、锅、裹}。通过已有的二关关系可以确定这两个候选字集合中候选字之间的二元关系。需要说明的是,候选字集合中包含的候选字的数量可以根据实际情况而定,而不限于上述的每个集合包含6个候选字的情况。
在本实施例的一些可选的实现方式中,上述确定相邻候选字集合之间候选字的二元关系可以包括:将第一拼音单元对应的第一候选字集合中的每个候选字,与第二拼音单元对应的第二候选字集合中的每个候选字进行二元关系匹配,得到第一候选字集合中候选字与第二候选字集合中候选字之间的二元关系序列,上述第一拼音单元与第二拼音单元相邻。
得到相邻的两个候选字集合后,从第一候选字集合后取出一个候选字,将这个候选字与第二候选字集合中的每一个候选字进行匹配。类似的,将第一个候选字集合中的其他候选字也与第二候选字集合中的每一个候选字进行匹配,最后得到二元关系序列。即,二元关系序列包括两个来自不同候选字集合的候选字,以及这两个候选字的匹配度值。
在本实施例的一些可选的实现方式中,上述确定相邻候选字集合之间候选字的二元关系还可以包括:上述第二拼音单元在上述拼音单元序列中的位置排在第一拼音单元之后,或上述第二拼音单元在上述拼音单元序列中的位置排在第一拼音单元之前。
对于某些文字而言,通过正向的二元关系能够准确地确定文字;而对于另一些文字,通过反向的二元关系能够准确确定文字。为此,第二拼音单元在拼音单元序列中的位置可以排在第一拼音单元之后,也可以排在第一拼音单元之前。当第二拼音单元在排在第一拼音单元之后时,先考虑第一拼音单元,再考虑第二拼音单元,此为正向的二元关系。例如,拼音信息为“zhongguo”,对应的第一拼音单元为“zhong”,第二拼音单元为“guo”,则先从{中、种、钟、重、肿、忠}中选择一个候选字,然后再从{过、郭、国、果、锅、裹}中选择一个候选字。通过查询现有的二元关系表可以确定,“中国”为匹配度值最大的二元关系。其中,上述二元关系表包含候选字的二元关系的匹配度值,二元关系表为通过大量数据统计得到的,具有很高的准确度。
当拼音信息为“youdian”时,得到的拼音单元为“you”和“dian”,可以采用反向的二元关系来选择候选字。此时,可以设置第二拼音单元为“you”,第一拼音单元为“dian”。即,第二拼音单元在排在第一拼音单元之前,此时,先考虑第一拼音单元,再考虑第二拼音单元。例如,先从第一拼音单元“dian”的候选字集合{点、电、店、垫、典、殿}中选择一个候选字,然后再从第二拼音单元“you”的候选字集合{有、由、又、右、油、游}中选择一个候选字,通过现有的二元关系可以确定,“有点”为匹配度值最大的二元关系。如果此时通过正向的二元关系来判断,则可能出现“有点”、“优点”、“邮电”、“有电”等匹配度值很接近的二元关系,不利于通过二元关系确定候选字。
在本实施例的一些可选的实现方式中,上述根据上述二元关系从候选字集合中筛选出与拼音信息对应的输出信息可以包括:从上述拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值(即匹配度值)最大时对应的候选字,得到对应拼音信息对应的输出信息,或者,从上述拼音单元序列的最后的一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息。
当采用正向的二元关系来选择候选字时,可以从拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息;反之,当采用反向的二元关系来选择候选字时,可以从拼音单元序列的最后一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息(即最终的候选字)。
在本实施例的一些可选的实现方式中,上述根据上述二元关系从候选字集合中筛选出与拼音信息对应的输出信息可以包括:当相邻的两个拼音单元中二元关系值小于设定阈值时,删除二元关系对应的候选字。
拼音信息切分得到的拼音单元是有序排列的,如果只考虑二元关系,则可能出现混乱选择候选字的情况。例如,拼音信息为“renmingongheguo”的目的文字为“人们共和国”,对应的拼音单元为“ren”、“min”、“gong”、“he”、“guo”。其中,拼音单元“ren”和“min”确定的候选字可以为“人民”;拼音单元“min”和“gong”确定的候选字可以为“民工”;拼音单元“gong”和“he”确定的候选字可以为“共和”;拼音单元“he”和“guo”确定的候选字可以为“喝过”。如果按照二元关系对上述拼音信息“renmingongheguo”进行选择候选字的话,对应的候选字为“人民共喝过”。而按照常识,目的文字应该是:“人民共和国”,出错的原因就在于每次都要确定相邻的拼音单元的二元关系,这样就把之前的二元关系给破坏了。为此,可以设定二元关系阈值,当相邻的两个拼音单元中二元关系值小于设定阈值时,可以不考虑这个二元关系,这样就避免了上述出现的问题。此外,如果相邻的二元关系相差很大的时候,也可以删除这个二元关系及对应的候选字。例如,拼音信息为“pinyinshuru”,对应的拼音单元为“pin”、“yin”、“shu”、“ru”,目的文字为“拼音输入”。拼音单元“pin”和“yin”确定的候选字可以为“拼音”;拼音单元“yin”和“shu”确定的候选字可以为“因数”;拼音单元“shu”和“ru”确定的候选字可以为“输入”。明显的,“因数”的二元关系的匹配度值要比“拼音”的二元关系的匹配度值和“输入”的二元关系的匹配度值低很多。因此,如果二元关系的匹配度值很高,可以认为对应的候选字固定下来,不必考虑该二元关系对应的拼音单元与其他拼音单元之间的二元关系。
上述方案可以在终端设备101、102、103上完成。但是,如果某些拼音单元没有在二元关系表中找到,则这些拼音单元可能与新出现的文字对应。此时,可以通过网络104和服务器105进行信息交互,从服务器105获取最新的二元关系表,或者直接在服务器105上确定拼音单元对应的候选字。
继续参见图3,图3是根据本实施例的用于获取信息的方法的应用场景的一个示意图。在图3的应用场景中,拼音信息为“ceshipinyinshuru”,目的文字为“测试拼音输入”。“head”和“tail”分别表示拼音信息的头和尾对应拼音信息的拼音单元为“ce”、“shi”、“pin”、“yin”、“shu”、“ru”。其中,拼音单元“ce”的候选字集合可以为{侧、测、册、策、厕};拼音单元“shi”的候选字集合可以为{是、时、食、视、市};拼音单元“pin”的候选字集合可以为{拼、品、频、贫、聘};拼音单元“yin”的候选字集合可以为{因、银、音、引、阴};拼音单元“shu”的候选字集合可以为{书、数、输、述、树};拼音单元“ru”的候选字集合可以为{如、入、乳、汝、儒},通过二元关系筛选候选字的过程如图3所示。最终找到图3中粗线对应的输出信息。需要说明的是,图3为通过正向的二元关系查找候选字的过程,反向的二元关系查找候选字的构成与正向的二元关系查找候选字的过程类似,只是从尾向头的方向选择候选词,此处不再一一赘述。
本申请的上述实施例提供的方法,通过二元关系确定拼音单元对应的候选字,最后得到对应拼音信息的输出信息,提高了拼音信息的识别精度。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种用于获取信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的用于获取信息的装置400可以包括:候选字集合获取单元401、二元关系确定单元402和输出信息确定单元403。其中,候选字集合获取单元401用于获取拼音信息中拼音单元对应的候选字集合,上述拼音单元用于筛选出候选字;二元关系确定单元402用于确定相邻候选字集合之间候选字的二元关系,上述二元关系用于表征相邻候选字集合之间候选字的匹配度;输出信息确定单元403用于根据上述二元关系从候选字集合中筛选出与拼音信息对应的输出信息。
在本实施例的一些可选的实现方式中,上述候选字集合获取单元401可以包括:切分子单元(图中未示出)和候选字查询子单元(图中未示出)。其中,切分子单元用于切分上述拼音信息得到拼音单元序列,上述拼音单元序列包括至少一个拼音单元;候选字查询子单元用于获取每个拼音单元对应的候选字集合。
在本实施例的一些可选的实现方式中,上述二元关系确定单元402可以包括:将第一拼音单元对应的第一候选字集合中的每个候选字,与第二拼音单元对应的第二候选字集合中的每个候选字进行二元关系匹配,得到第一候选字集合中候选字与第二候选字集合中候选字之间的二元关系序列,上述第一拼音单元与第二拼音单元相邻。
在本实施例的一些可选的实现方式中,上述二元关系确定单元402还可以包括:上述第二拼音单元在上述拼音单元序列中的位置排在第一拼音单元之后,或上述第二拼音单元在上述拼音单元序列中的位置排在第一拼音单元之前。
在本实施例的一些可选的实现方式中,上述输出信息确定单元403可以包括:从上述拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息,或者,从上述拼音单元序列的最后的一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息。
在本实施例的一些可选的实现方式中,上述输出信息确定单元403还可以包括:当相邻的两个拼音单元中二元关系值小于设定阈值时,删除二元关系对应的候选字。
下面参考图5,其示出了适于用来实现本申请实施例的服务器的计算机系统500的结构示意图。图5示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括候选字集合获取单元、二元关系确定单元和输出信息确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,输出信息确定单元还可以被描述为“用于根据二元关系确定输出信息的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取拼音信息中拼音单元对应的候选字集合,上述拼音单元用于筛选出候选字;确定相邻候选字集合之间候选字的二元关系,上述二元关系用于表征相邻候选字集合之间候选字的匹配度;根据上述二元关系从候选字集合中筛选出与拼音信息对应的输出信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种用于获取信息的方法,其特征在于,所述方法包括:
获取拼音信息中拼音单元对应的候选字集合,所述拼音单元用于筛选出候选字;
确定相邻候选字集合之间候选字的二元关系,其中,二元关系用于表征相邻候选字集合之间候选字的匹配度;
根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息。
2.根据权利要求1所述的方法,其特征在于,所述获取拼音信息中拼音单元对应的候选字集合包括:
切分所述拼音信息得到拼音单元序列,所述拼音单元序列包括至少一个拼音单元;
获取每个拼音单元对应的候选字集合。
3.根据权利要求2所述的方法,其特征在于,所述确定相邻候选字集合之间候选字的二元关系包括:
将第一拼音单元对应的第一候选字集合中的每个候选字,与第二拼音单元对应的第二候选字集合中的每个候选字进行二元关系匹配,得到第一候选字集合中候选字与第二候选字集合中候选字之间的二元关系序列,所述第一拼音单元与第二拼音单元相邻。
4.根据权利要求3所述的方法,其特征在于,所述确定相邻候选字集合之间候选字的二元关系还包括:
所述第二拼音单元在所述拼音单元序列中的位置排在第一拼音单元之后,或所述第二拼音单元在所述拼音单元序列中的位置排在第一拼音单元之前。
5.根据权利要求4所述的方法,其特征在于,所述根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息包括:
从所述拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息,或者,从所述拼音单元序列的最后的一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息。
6.根据权利要求4所述的方法,其特征在于,所述根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息还包括:
当相邻的两个拼音单元中二元关系值小于设定阈值时,删除二元关系对应的候选字。
7.一种用于获取信息的装置,其特征在于,所述装置包括:
候选字集合获取单元,用于获取拼音信息中拼音单元对应的候选字集合,所述拼音单元用于筛选出候选字;
二元关系确定单元,用于确定相邻候选字集合之间候选字的二元关系,其中,二元关系用于表征相邻候选字集合之间候选字的匹配度;
输出信息确定单元,用于根据二元关系从候选字集合中筛选出与拼音信息对应的输出信息。
8.根据权利要求7所述的装置,其特征在于,所述输出信息确定单元包括:
从所述拼音单元序列的第一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息,或者,从所述拼音单元序列的最后的一个拼音单元开始,依次确定相邻的两个拼音单元中二元关系值最大时对应的候选字,得到对应拼音信息对应的输出信息。
9.一种服务器,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行权利要求1至6中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一所述的方法。
CN201710487359.XA 2017-06-23 2017-06-23 用于获取信息的方法、装置及服务器 Active CN109116996B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710487359.XA CN109116996B (zh) 2017-06-23 2017-06-23 用于获取信息的方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710487359.XA CN109116996B (zh) 2017-06-23 2017-06-23 用于获取信息的方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN109116996A true CN109116996A (zh) 2019-01-01
CN109116996B CN109116996B (zh) 2023-06-20

Family

ID=64733236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710487359.XA Active CN109116996B (zh) 2017-06-23 2017-06-23 用于获取信息的方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN109116996B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060070975A (ko) * 2004-12-21 2006-06-26 주식회사 팬택 이동 통신 단말기의 키패드 설정 방법 및 장치
CN101290632A (zh) * 2008-05-30 2008-10-22 北京搜狗科技发展有限公司 一种用户词参与智能组词输入的方法及一种输入法系统
CN101419527A (zh) * 2007-10-19 2009-04-29 株式会社理光 信息处理、输出、显示、及形成装置、用户属性判断方法
CN102455845A (zh) * 2010-10-14 2012-05-16 北京搜狗科技发展有限公司 一种文字输入方法和装置
CN102866782A (zh) * 2011-07-06 2013-01-09 哈尔滨工业大学 一种提高整句生成效率的输入法和输入法系统
CN103064967A (zh) * 2012-12-31 2013-04-24 百度在线网络技术(北京)有限公司 一种用于建立用户二元关系库的方法与设备
US20160004324A1 (en) * 2014-07-02 2016-01-07 Suzhou Snail Technology Digital Co.,Ltd Key function conversion method, key function conversion device and electronic equipment
CN106339105A (zh) * 2016-08-25 2017-01-18 百度在线网络技术(北京)有限公司 用于识别拼音信息的方法及装置
CN106774975A (zh) * 2016-11-30 2017-05-31 百度在线网络技术(北京)有限公司 输入方法和装置
CN106873798A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 用于输出信息的方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060070975A (ko) * 2004-12-21 2006-06-26 주식회사 팬택 이동 통신 단말기의 키패드 설정 방법 및 장치
CN101419527A (zh) * 2007-10-19 2009-04-29 株式会社理光 信息处理、输出、显示、及形成装置、用户属性判断方法
CN101290632A (zh) * 2008-05-30 2008-10-22 北京搜狗科技发展有限公司 一种用户词参与智能组词输入的方法及一种输入法系统
CN102455845A (zh) * 2010-10-14 2012-05-16 北京搜狗科技发展有限公司 一种文字输入方法和装置
CN102866782A (zh) * 2011-07-06 2013-01-09 哈尔滨工业大学 一种提高整句生成效率的输入法和输入法系统
CN103064967A (zh) * 2012-12-31 2013-04-24 百度在线网络技术(北京)有限公司 一种用于建立用户二元关系库的方法与设备
US20160004324A1 (en) * 2014-07-02 2016-01-07 Suzhou Snail Technology Digital Co.,Ltd Key function conversion method, key function conversion device and electronic equipment
CN106339105A (zh) * 2016-08-25 2017-01-18 百度在线网络技术(北京)有限公司 用于识别拼音信息的方法及装置
CN106774975A (zh) * 2016-11-30 2017-05-31 百度在线网络技术(北京)有限公司 输入方法和装置
CN106873798A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 用于输出信息的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏雅芳: "基于Android平台的智能拼音输入法的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 2, pages 138 - 1015 *

Also Published As

Publication number Publication date
CN109116996B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US10417333B2 (en) Apparatus and method for executing application
CN109992763A (zh) 语言标注处理方法、系统、电子设备及计算机可读介质
CN108287927B (zh) 用于获取信息的方法及装置
CN107992554A (zh) 提供问答信息的聚合结果的搜索方法和装置
CN107731229A (zh) 用于识别语音的方法和装置
CN106919711B (zh) 基于人工智能的标注信息的方法和装置
CN108280200B (zh) 用于推送信息的方法和装置
CN109828906B (zh) Ui自动化测试方法、装置、电子设备及存储介质
EP3358474A1 (en) Route search method, device and apparatus, and non-volatile computer storage medium
US20140245224A1 (en) Method of displaying programs and electronic device therefor
CN109815365A (zh) 用于处理视频的方法和装置
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
CN107590252A (zh) 用于信息交互的方法及装置
CN110347908A (zh) 语音购物方法、装置、介质及电子设备
CN107748879A (zh) 用于获取人脸信息的方法及装置
CN110084658A (zh) 物品匹配的方法和装置
CN106909232A (zh) 用于展示候选词条的方法和装置
CN112084342A (zh) 试题生成方法、装置、计算机设备及存储介质
CN109284367A (zh) 用于处理文本的方法和装置
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN103399737B (zh) 基于语音数据的多媒体处理方法及装置
CN108182180B (zh) 用于生成信息的方法和装置
CN114357325A (zh) 内容搜索方法、装置、设备及介质
CN108460020A (zh) 用于获取信息的方法及装置
CN107832373B (zh) 数据的查找及显示方法及其系统、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant