CN106339105A - 用于识别拼音信息的方法及装置 - Google Patents

用于识别拼音信息的方法及装置 Download PDF

Info

Publication number
CN106339105A
CN106339105A CN201610729886.2A CN201610729886A CN106339105A CN 106339105 A CN106339105 A CN 106339105A CN 201610729886 A CN201610729886 A CN 201610729886A CN 106339105 A CN106339105 A CN 106339105A
Authority
CN
China
Prior art keywords
information
input information
candidate
pinyin
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610729886.2A
Other languages
English (en)
Inventor
向军志
陈丽敏
谭凤影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610729886.2A priority Critical patent/CN106339105A/zh
Publication of CN106339105A publication Critical patent/CN106339105A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了用于识别拼音信息的方法及装置。所述方法的一具体实施方式包括:获取用户通过终端输入的待识别拼音信息,待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;确定是否存在模糊音映射关系集合,若存在,则根据模糊音映射关系集合获取与待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与待识别拼音信息对应的候选输入信息。该实施方式提高了对待识别拼音信息的识别准确率。

Description

用于识别拼音信息的方法及装置
技术领域
本申请涉及数据处理技术领域,具体涉及信息识别技术领域,尤其涉及用于识别拼音信息的方法及装置。
背景技术
随着科技的发展,各种智能设备也应运而生,这些智能设备通常具备很好的便携性,强大的数据处理功能和联网功能,提高了人们工作和学习的效率,成为人们工作和生活中不可或缺的组成部分。智能设备经常需要输入信息来进行相应的数据处理,输入法应用就成为了智能设备必备的应用。现有的输入法不仅能快速显示对应的输入信息,还具有一定程度的纠错功能,使得用户在输入错误的拼音信息时,也能获得一定精度的正确输入信息。其中,拼音信息通常是用于得到词组或短语等非单个文字的拼音信息。
然而,现有的输入法在识别拼音信息时还存在一些不足。现有的输入法在遇到错误的拼音信息时,会将查找与该错误的拼音信息最接近的其他正确的拼音信息,以便查找到对应的词组或短语。但用该方法找到的输入信息准确率低。
发明内容
本申请提供了用于识别拼音信息的方法及装置,以解决背景技术中提到的技术问题。
第一方面,本申请提供了一种用于识别拼音信息的方法,所述方法包括:获取用户通过终端输入的待识别拼音信息,所述待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;确定是否存在模糊音映射关系集合,若存在,则根据所述模糊音映射关系集合获取与所述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息,其中,所述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,所述地理位置信息用于表征终端当前所在的地理位置。
在一些实施例中,所述根据所述模糊音映射关系集合获取与所述待识别拼音信息对应的候选输入信息包括:根据模糊音映射关系集合查找用户词库中是否存在与所述待识别拼音信息对应的候选输入信息,若存在,则显示该候选输入信息,否则,从系统词库中查找与所述待识别拼音信息对应的候选输入信息,所述用户词库用于存储用户的历史拼音信息和对应所述历史拼音信息的历史候选输入信息,所述系统词库用于存储与拼音信息对应的候选输入信息。
在一些实施例中,所述从系统词库中查找与所述待识别拼音信息对应的候选输入信息包括:通过模糊音映射关系集合对所述待识别拼音信息进行修正得到至少一个修正拼音信息;从所述系统词库中查找与所述至少一个修正拼音信息对应的至少一个候选输入信息,并显示该至少一个候选输入信息。
在一些实施例中,所述通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息包括:查找系统词库中与所述待识别拼音信息对应的候选输入信息,确定所述候选输入信息的匹配度,若所述匹配度大于设定阈值,则显示该候选输入信息,否则,查看终端当前所在的地理位置信息,根据所述地理位置信息获取所述待识别拼音信息对应的候选输入信息,所述匹配度用于通过输入信息的使用频率来表征候选输入信息的准确度,所述系统词库用于存储与拼音信息对应的候选输入信息。
在一些实施例中,所述根据所述地理位置信息获取所述待识别拼音信息对应的候选输入信息包括:确定对应所述地理位置信息的模糊音推荐词库,所述模糊音推荐词库用于存储地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息;查看所述模糊音推荐词库中是否存在与所述待识别拼音信息对应的候选输入信息,若有,则显示该候选输入信息,否则,根据所述模糊音推荐词库对应的地理位置模糊音映射关系集合对所述待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找与所述地理位置修正拼音信息对应的候选输入信息,其中,地理位置模糊音映射关系用于表征地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息之间的对应关系。
在一些实施例中,所述通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息还包括:若无法从所述系统词库中查找到与所述地理位置修正拼音信息对应的候选输入信息,则将所述待识别拼音信息按照单个字输入信息进行拆分得到拼音单元信息,并从所述系统词库中查找与所述拼音单元信息对应的候选输入信息。
在一些实施例中,所述方法还包括:获取用户从所述候选输入信息中选定的输入信息,若该输入信息不在所述用户词库中,并且该输入信息对应的待识别拼音信息连续第一设定次数输入错误,则建立该输入信息和所述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到所述模糊音映射关系集合,并将该输入信息和所述待识别拼音信息加入所述用户词库。
在一些实施例中,所述方法还包括:若所述输入信息属于所述用户词库,并且该输入信息对应的待识别拼音信息连续第二设定次数输入正确,则从所述用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从所述模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
第二方面,本申请提供了一种用于识别拼音信息的装置,所述装置包括:待识别拼音信息获取单元,用于获取用户通过终端输入的待识别拼音信息,所述待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;候选输入信息获取单元,用于确定是否存在模糊音映射关系集合,若存在,则根据所述模糊音映射关系集合获取与所述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息,其中,所述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,所述地理位置信息用于表征终端当前所在的地理位置。
在一些实施例中,所述候选输入信息获取单元包括:第一候选输入信息获取子单元,用于根据模糊音映射关系集合查找用户词库中是否存在与所述待识别拼音信息对应的候选输入信息,若存在,则显示该候选输入信息,否则,从系统词库中查找与所述待识别拼音信息对应的候选输入信息,所述用户词库用于存储用户的历史拼音信息和对应所述历史拼音信息的历史候选输入信息,所述系统词库用于存储与拼音信息对应的候选输入信息。
在一些实施例中,所述第一候选输入信息获取子单元包括:修正模块,用于通过模糊音映射关系集合对所述待识别拼音信息进行修正得到至少一个修正拼音信息;第一查找模块,用于从所述系统词库中查找与所述至少一个修正拼音信息对应的至少一个候选输入信息,并显示该至少一个候选输入信息。
在一些实施例中,所述候选输入信息获取单元包括:第二候选输入信息获取子单元,用于查找系统词库中与所述待识别拼音信息对应的候选输入信息,确定所述候选输入信息的匹配度,若所述匹配度大于设定阈值,则显示该候选输入信息,否则,查看终端当前所在的地理位置信息,根据所述地理位置信息获取所述待识别拼音信息对应的候选输入信息,所述匹配度用于通过输入信息的使用频率来表征候选输入信息的准确度,所述系统词库用于存储与拼音信息对应的输入信息。
在一些实施例中,所述第二候选输入信息获取子单元包括:模糊音推荐词库确定模块,用于确定对应所述地理位置信息的模糊音推荐词库,所述模糊音推荐词库用于存储地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息;第二查找模块,用于查看所述模糊音推荐词库中是否存在与所述待识别拼音信息对应的候选输入信息,若有,则显示该候选输入信息,否则,根据所述模糊音推荐词库对应的地理位置模糊音映射关系集合对所述待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找与所述地理位置修正拼音信息对应的候选输入信息,其中,地理位置模糊音映射关系用于表征地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息之间的对应关系。
在一些实施例中,所述第二候选输入信息获取子单元还包括:第三查找模块,用于在无法从所述系统词库中查找到与所述地理位置修正拼音信息对应的候选输入信息时,将所述待识别拼音信息按照单个字输入信息进行拆分得到拼音单元信息,并从所述系统词库中查找与所述拼音单元信息对应的候选输入信息。
在一些实施例中,所述装置还包括:第一更新单元,用于获取用户从所述候选输入信息中选定的输入信息,若该输入信息不在所述用户词库中,并且该输入信息对应的待识别拼音信息连续第一设定次数输入错误,则建立该输入信息和所述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到所述模糊音映射关系集合,并将该输入信息和所述待识别拼音信息加入所述用户词库。
在一些实施例中,所述装置还包括:第二更新单元,用于在所述输入信息属于所述用户词库,并且该输入信息对应的待识别拼音信息连续第二设定次数输入正确时,从所述用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从所述模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
本申请提供的用于识别拼音信息的方法及装置,在存在模糊音映射关系集合时,根据模糊音映射关系集合快速找到候选输入信息,当不存在模糊音映射关系集合时,根据地理位置信息确定候选输入信息,提高了对待识别拼音信息的识别准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于识别拼音信息的方法一个实施例的流程图;
图3是根据本申请的用于识别拼音信息的方法一个实施例的应用场景的一个示意图;
图4是根据本申请的通过地理位置信息查询候选输入信息的流程图;
图5是根据本申请的建立模糊音映射关系的流程图;
图6是根据本申请的用于识别拼音信息的装置的一个实施例的结构示意图;
图7是根据本申请的控制器的一个实施例的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于识别拼音信息的方法或用于识别拼音信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端101、102、103,网络104和服务器105。网络104用以在终端101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端101、102、103上可以安装有各种信息应用,例如输入法应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端101、102、103可以是具有显示屏并且支持拼音输入的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts GroupAudio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如为终端101、102、103上用户输入的拼音信息提供对应的候选输入信息的输入法服务器。输入法服务器可以对获取到的待识别拼音信息进行分析等处理,并将处理结果(例如文字、词组或短语等)反馈给终端设备。
需要说明的是,本申请实施例所提供的用于识别拼音信息的方法可以由终端101、102、103单独执行,或者也可以由终端101、102、103和服务器105共同执行。一般情况下,用于识别拼音信息的方法由终端101、102、103执行。相应地,用于识别拼音信息的装置可以设置于终端101、102、103中,也可以设置于服务器105中。
应该理解,图1中的终端、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端、网络和服务器。
图2,其示出了一种用于识别拼音信息的方法的一个实施例的流程图200,该用于识别拼音信息的方法包括:
步骤201,获取用户通过终端输入的待识别拼音信息。
本实施例中,用于识别拼音信息的方法运行与其上的电子设备(例如图1所示的终端或服务器)可以通过有线连接方式或者无线连接方式获取用户输入的待识别拼音信息,其中,上述待识别拼音信息用于获取词组输入信息和/或短语输入信息,包括了多个字符和/或多个字符组合。
用户通过终端101、102、103输入待识别拼音信息可以分为两种,第一种是为了获得单个字的拼音信息,例如,待识别拼音信息为“wo”,对应的候选输入信息包括:我、窝、喔、握、卧等。第二种是为了获得词组或短语的拼音信息,例如,待识别拼音信息为“zhidao”,对应的候选输入信息包括:知道、指导、直到、之道、执导等。其中,第一种拼音信息分析过程简单,并容易获取到准确的输入信息,而第二种拼音信息则包含了多种的可能性,不容易获取到准确的输入信息,本申请技术方案是针对第二种拼音信息提出的。
步骤202,确定是否存在模糊音映射关系集合,若存在,则根据上述模糊音映射关系集合获取与上述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与上述待识别拼音信息对应的候选输入信息。
其中,上述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,上述地理位置信息用于表征终端当前所在的地理位置。
用户在终端101、102、103上输入拼音信息后,输入法应用会根据该拼音信息查找出对应的候选输入信息(当输入法为汉语时,候选输入信息通常是汉字和/或汉字词组,当输入法是其他语种时,对应的还可以是其他语种的输入信息)。用户输入的待识别拼音信息可以是对应的输入信息的完整拼写,例如,输入信息为“知道”时,对应的待识别拼音信息的完整拼写为“zhidao”;待识别拼音信息也可以是对应的输入信息的部分拼写。例如,待识别拼音信息的完整拼写为“zhid”,此时也能得到输入信息“知道”。经过一段时间的使用后,输入法会记录用户的输入习惯,根据用户的习惯拼音输入和用户从候选输入信息中选择的输入信息得到模糊音映射关系集合。当用户在此输入相同的待识别拼音信息时,根据模糊音映射关系集合就可以马上确定用户想要的输入信息。当无法通过模糊音映射关系集合得到用户想要的输入信息时,通常是由于用户输入的待识别拼音信息不是完整拼写或不是正确拼写,这种情况下通常无法找到正确的输入信息。实际中,用户输入的待识别拼音信息为不完整拼写或错误拼写的原因,通常是由于不同地理位置的用户的发音习惯或拼写习惯不同造成的。因此,本申请通过终端当前所在的地理位置信息(用户所在的地理位置信息通常可以通过用户使用的终端所在的地理位置信息来确定)来确定待识别拼音信息对应的候选输入信息,能够极大地提高对待识别拼音信息的识别准确性。
在本实施例的一些可选的实现方式中,上述根据上述模糊音映射关系集合获取与上述待识别拼音信息对应的候选输入信息可以包括:根据模糊音映射关系集合查找用户词库中是否存在与上述待识别拼音信息对应的候选输入信息,若存在,则显示该候选输入信息,否则,从系统词库中查找与上述待识别拼音信息对应的候选输入信息。
其中,上述用户词库用于存储用户的历史拼音信息和对应上述历史拼音信息的历史候选输入信息,上述系统词库用于存储与拼音信息对应的候选输入信息,系统词库可以是现代汉语大字典、新编新华字典等。通过模糊音映射关系集合能够确定待识别拼音信息是否属于用户词库,如果是,则能够直接从用户词库中找到对应待识别拼音信息的候选输入信息,则在输入法的显示框内显示该候选输入信息;当无法从用户词库中找到对应待识别拼音信息的候选输入信息时,说明该待识别拼音信息不属于用户的常用词,此时需要从系统词库中查询对应待识别拼音信息的候选输入信息。
在本实施例的一些可选的实现方式中,上述从系统词库中查找与上述待识别拼音信息对应的候选输入信息可以包括以下步骤:
第一步,通过模糊音映射关系集合对上述待识别拼音信息进行修正得到至少一个修正拼音信息。
模糊音映射关系集合里包含了用户使用频率最高的拼音信息和输入信息之间的对应关系,为了准确地从系统词库中找到与待识别拼音信息对应的候选输入信息,可以根据模糊音映射关系对待识别拼音信息进行修正,然后再从系统词库中查找是否存在对应修正后的待识别拼音信息的候选输入信息。
常见的模糊音映射关系可以是:“zi”等价于“zhi”、“niao”等价于“liao”等。例如,待识别拼音信息是“zid”,根据模糊音映射关系修正后为“zhid”、“zhida”和“zhidao”。此时,就能从系统词库中找到对应“zhid”、“zhida”和“zhidao”的候选输入信息。
第二步,从上述系统词库中查找与上述至少一个修正拼音信息对应的至少一个候选输入信息,并显示该至少一个候选输入信息。
得到上述的修正拼音信息后,可以从系统词库中分别找到对应修正拼音信息的候选输入信息。
在本实施例的一些可选的实现方式中,上述通过地理位置信息确定与上述待识别拼音信息对应的候选输入信息可以包括:查找系统词库中与上述待识别拼音信息对应的候选输入信息,确定上述候选输入信息的匹配度,若上述匹配度大于设定阈值,则显示该候选输入信息,否则,查看终端当前所在的地理位置信息,根据上述地理位置信息获取上述待识别拼音信息对应的候选输入信息。
其中,上述匹配度用于通过输入信息的使用频率来表征候选输入信息的准确度,上述系统词库用于存储与拼音信息对应的候选输入信息。
如果修正拼音信息仍然无法找到对应的候选输入信息,则认为当前的待识别拼音信息与用户的习惯输入无关,此时,就可以将待识别拼音信息视为正确的完整拼写在系统词库中查找对应的候选输入信息了。系统词库会找到对应待识别拼音信息的候选输入信息,这些候选输入信息有各自的使用频率,可以根据这些使用频率可以判断待识别拼音信息与候选输入信息的匹配度,进而判断系统词库找到的这些候选输入信息相对于待识别拼音信息的准确度。如果匹配度大于设定阈值,则说明待识别拼音信息能够找到正确的候选输入信息,否则,则认为待识别拼音信息不是完整拼写。最有效的办法是查找终端当前的地理位置信息,然后获取到该地理位置信息的拼写习惯等信息,根据这些拼写习惯对待识别拼写信息进行查询。
在本实施例的一些可选的实现方式中,上述根据上述地理位置信息获取上述待识别拼音信息对应的候选输入信息可以包括以下步骤:
第一步,确定对应上述地理位置信息的模糊音推荐词库。
确定了终端的地理位置信息后,可以查找对应该地理位置信息的模糊音推荐词库,上述模糊音推荐词库用于存储地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息,代表了该地理位置信息对应的用户的拼写习惯和输入习惯。例如,模糊音推荐词库可以包括四川话词库、河南话词库、上海话词库、闽南话词库和温州话词库等。
第二步,查看上述模糊音推荐词库中是否存在与上述待识别拼音信息对应的候选输入信息,若有,则显示该候选输入信息,否则,根据上述模糊音推荐词库对应的地理位置模糊音映射关系集合对上述待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找与上述地理位置修正拼音信息对应的候选输入信息。
其中,地理位置模糊音映射关系用于表征地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息之间的对应关系。
得到模糊音推荐词库后,查找模糊音推荐词库中是否存在与待识别拼音信息对应的候选输入信息,如有,则在输入法的显示框内显示该候选输入信息;否则,通过模糊音推荐词库对应的地理位置模糊音映射关系集合对待识别拼音信息进行修正得到地理位置修正拼音信息,并从系统词库中查找是否存在与地理位置修正拼音信息对应的候选输入信息。
在本实施例的一些可选的实现方式中,上述通过地理位置信息确定与上述待识别拼音信息对应的候选输入信息还可以包括:若无法从上述系统词库中查找到与上述地理位置修正拼音信息对应的候选输入信息,则将上述待识别拼音信息按照单个字输入信息进行拆分得到拼音单元信息,并从上述系统词库中查找与上述拼音单元信息对应的候选输入信息。
如果无法从模糊音推荐词库中到对应的候选输入信息,则说明该待识别拼音信息不具有该地理位置信息对应的拼写习惯或发音习惯,待识别拼音信息可能是近期才出现的网络词组或网络短语等。此时可以将该待识别拼音信息逐字进行分解得到拼音单元信息(单个字或单个字符对应的拼音信息),让用户选择哪些字组合起来是用户想要的输入信息。
在本实施例的一些可选的实现方式中,本实施例上述方法还可以包括:获取用户从上述候选输入信息中选定的输入信息,若该输入信息不在上述用户词库中,并且该输入信息对应的待识别拼音信息连续第一设定次数输入错误,则建立该输入信息和上述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到上述模糊音映射关系集合,并将该输入信息和上述待识别拼音信息加入上述用户词库。
当显示了候选输入信息后,用户会根据需要选择对应待识别拼音信息的候选输入信息,即用户选定的输入信息。如果这个输入信息不在用户词库中,并且用户在获取该输入信息时输入的待识别拼音信息连续多次出现错误(此处的错误是指待识别拼音信息不是该输入信息的完整拼写),则可以认为待识别拼音信息与用户的拼写习惯或发音习惯有关,而用户本身知道对应该待识别拼音信息的正确的输入信息。此时可以建立该输入信息和上述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到上述模糊音映射关系集合,并将该输入信息和上述待识别拼音信息加入上述用户词库,以便后续再出现类似的拼写习惯时找到正确的输入信息。
在本实施例的一些可选的实现方式中,本实施例上述方法还可以包括:若上述输入信息属于上述用户词库,并且该输入信息对应的待识别拼音信息连续第二设定次数输入正确,则从上述用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从上述模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
当用户意识到自己存在拼写错误时,可以对自己的拼写习惯进行改正。改正后,在获取某一输入信息时,待识别拼音信息会与改正拼写习惯之前的待识别拼音信息不同,如果该输入信息属于用户词库,说明该输入信息为用户常用的输入信息,则可以在对应该输入信息的待识别拼音信息正确拼写第二设定次数后,认为用户已经能够正确拼写(此处的正确是指待识别拼音信息是该输入信息的完整拼写)。此时,可以从用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
继续参见图3,图3是根据本实施例的用于识别拼音信息的方法的应用场景的一个示意图。由图3可知,本实施例获取到用户通过终端输入的待识别拼音信息后,首先判断是否存在模糊音映射关系集合,若存在,则根据模糊音映射关系集合从用户词典中获取与待识别拼音信息对应的候选输入信息,否则,通过地理位置信息查询候选输入信息;如果用户词典中有候选输入信息,则显示候选输入信息,否则,通过模糊音映射关系集合对待识别拼音信息修正,然后再通过系统词库查找候选输入信息,当得到的候选输入信息的匹配度大于设定阈值,则显示候选输入信息,否则通过地理位置信息查询候选输入信息。
图4为通过地理位置信息查询候选输入信息的流程图。由图4可知,先通过系统词库查看获得的候选输入信息的匹配度是否大于设定阈值,若是,则说明待识别拼音信息属于正确的拼写,否则,查找终端所在的地理位置信息,并通过地理位置信息对应的模糊音推荐词库查询候选输入信息,如果存在对应待识别拼音信息的候选输入信息,则显示候选输入信息,否则,通过模糊音推荐词库对应的地理位置模糊音映射关系集合对待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找对应地理位置修正拼音信息的候选输入信息,若有,则显示候选输入信息,否则,说明待识别拼音信息无法找到对应的词组或短语,此时可以按照拼音单元信息逐个显示待识别拼音信息对应的字或字符。
图5为建立模糊音映射关系的流程图,经过一段时间的使用后,如果用户输入的待识别拼音信息仍然与用户选定的输入信息不匹配(待识别拼音信息拼写错误),可以认为用户有自己的拼写习惯,此时,可以根据该待识别拼音信息与输入信息建立模糊音映射关系,以便后续再遇到类似的拼音拼写时及时找到正确的输入信息。当用户能够连续输入正确的待识别拼音信息,而该待识别拼音信息对应的输入信息又属于用户词典时,可以将对应该输入信息和待识别拼音信息的模糊音映射关系删除。
当用户最终选定的输入信息在用户词库中,但用户最近几次输入的待识别拼音信息出现错误(不与模糊音映射关系中的拼音信息相同)时,则在用户再次输入该待识别拼音信息时,将该输入信息放置在用户词库提供的候选输入信息之后显示;当用户最终选定的输入信息不在用户词库中,则在用户再次输入该待识别拼音信息时,将该输入信息放置在系统词库提供的完全匹配的候选输入信息之后显示。
本申请提供的用于识别拼音信息的方法,在存在模糊音映射关系集合时,根据模糊音映射关系集合快速找到候选输入信息,当不存在模糊音映射关系集合时,根据地理位置信息确定候选输入信息,提高了对待识别拼音信息的识别准确率。
进一步参考图6,作为对上述各图所示方法的实现,本申请提供了一种用于识别拼音信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例上述的用于识别拼音信息的装置600可以包括:待识别拼音信息获取单元601和候选输入信息获取单元602。其中,待识别拼音信息获取单元601用于获取用户通过终端输入的待识别拼音信息,上述待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;候选输入信息获取单元602用于确定是否存在模糊音映射关系集合,若存在,则根据上述模糊音映射关系集合获取与上述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与上述待识别拼音信息对应的候选输入信息,其中,上述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,上述地理位置信息用于表征终端当前所在的地理位置。
在本实施例的一些可选的实现方式中,上述候选输入信息获取单元602包括:第一候选输入信息获取子单元(图中未示出),用于根据模糊音映射关系集合查找用户词库中是否存在与上述待识别拼音信息对应的候选输入信息,若存在,则显示该候选输入信息,否则,从系统词库中查找与上述待识别拼音信息对应的候选输入信息,上述用户词库用于存储用户的历史拼音信息和对应上述历史拼音信息的历史候选输入信息,上述系统词库用于存储与拼音信息对应的候选输入信息。
在本实施例的一些可选的实现方式中,上述第一候选输入信息获取子单元包括:修正模块(图中未示出)和第一查找模块(图中未示出)。其中,修正模块用于通过模糊音映射关系集合对上述待识别拼音信息进行修正得到至少一个修正拼音信息;第一查找模块用于从上述系统词库中查找与上述至少一个修正拼音信息对应的至少一个候选输入信息,并显示该至少一个候选输入信息。
在本实施例的一些可选的实现方式中,上述候选输入信息获取单元602包括:第二候选输入信息获取子单元(图中未示出),用于查找系统词库中与上述待识别拼音信息对应的候选输入信息,确定上述候选输入信息的匹配度,若上述匹配度大于设定阈值,则显示该候选输入信息,否则,查看终端当前所在的地理位置信息,根据上述地理位置信息获取上述待识别拼音信息对应的候选输入信息,上述匹配度用于通过输入信息的使用频率来表征候选输入信息的准确度,上述系统词库用于存储与拼音信息对应的候选输入信息。
本实施例的一些可选的实现方式中,上述第二候选输入信息获取子单元包括:模糊音推荐词库确定模块(图中未示出),用于确定对应上述地理位置信息的模糊音推荐词库,上述模糊音推荐词库用于存储地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息;第二查找模块,用于查看上述模糊音推荐词库中是否存在与上述待识别拼音信息对应的候选输入信息,若有,则显示该候选输入信息,否则,根据上述模糊音推荐词库对应的地理位置模糊音映射关系集合对上述待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找与上述地理位置修正拼音信息对应的候选输入信息,其中,地理位置模糊音映射关系用于表征地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息之间的对应关系。
在本实施例的一些可选的实现方式中,上述第二候选输入信息获取子单元还包括:第三查找模块(图中未示出),用于在无法从上述系统词库中查找到与上述地理位置修正拼音信息对应的候选输入信息时,将上述待识别拼音信息按照单个字输入信息进行拆分得到拼音单元信息,并从上述系统词库中查找与上述拼音单元信息对应的候选输入信息。
在本实施例的一些可选的实现方式中,用于识别拼音信息的装置600还包括:第一更新单元(图中未示出),用于获取用户从上述候选输入信息中选定的输入信息,若该输入信息不在上述用户词库中,并且该输入信息对应的待识别拼音信息连续第一设定次数输入错误,则建立该输入信息和上述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到上述模糊音映射关系集合,并将该输入信息和上述待识别拼音信息加入上述用户词库。
在本实施例的一些可选的实现方式中,用于识别拼音信息的装置600还包括:第二更新单元(图中未示出),用于在上述输入信息属于上述用户词库,并且该输入信息对应的待识别拼音信息连续第二设定次数输入正确时,从上述用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从上述模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
需要说明的是,上述的用于识别拼音信息的方法和用于识别拼音信息的装置都是基于输入法实现的。
下面参考图7,其示出了适于用来实现本申请实施例的服务器的计算机系统700的结构示意图。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM703中,还存储有系统700操作所需的各种程序和数据。CPU701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括待识别拼音信息获取单元和候选输入信息获取单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,候选输入信息获取单元还可以被描述为“用于确定候选输入信息的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:获取用户通过终端输入的待识别拼音信息,上述待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;确定是否存在模糊音映射关系集合,若存在,则根据上述模糊音映射关系集合获取与上述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与上述待识别拼音信息对应的候选输入信息,其中,上述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,上述地理位置信息通过终端当前所在的地理位置确定。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种用于识别拼音信息的方法,其特征在于,所述方法包括:
获取用户通过终端输入的待识别拼音信息,所述待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;
确定是否存在模糊音映射关系集合,若存在,则根据所述模糊音映射关系集合获取与所述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息,其中,所述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,所述地理位置信息用于表征终端当前所在的地理位置。
2.根据权利要求1所述的方法,其特征在于,所述根据所述模糊音映射关系集合获取与所述待识别拼音信息对应的候选输入信息包括:
根据模糊音映射关系集合查找用户词库中是否存在与所述待识别拼音信息对应的候选输入信息,若存在,则显示该候选输入信息,否则,从系统词库中查找与所述待识别拼音信息对应的候选输入信息,所述用户词库用于存储用户的历史拼音信息和对应所述历史拼音信息的历史候选输入信息,所述系统词库用于存储与拼音信息对应的候选输入信息。
3.根据权利要求2所述的方法,其特征在于,所述从系统词库中查找与所述待识别拼音信息对应的候选输入信息包括:
通过模糊音映射关系集合对所述待识别拼音信息进行修正得到至少一个修正拼音信息;
从所述系统词库中查找与所述至少一个修正拼音信息对应的至少一个候选输入信息,并显示该至少一个候选输入信息。
4.根据权利要求1所述的方法,其特征在于,所述通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息包括:
查找系统词库中与所述待识别拼音信息对应的候选输入信息,确定所述候选输入信息的匹配度,若所述匹配度大于设定阈值,则显示该候选输入信息,否则,查看终端当前所在的地理位置信息,根据所述地理位置信息获取所述待识别拼音信息对应的候选输入信息,所述匹配度用于通过输入信息的使用频率来表征候选输入信息的准确度,所述系统词库用于存储与拼音信息对应的候选输入信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述地理位置信息获取所述待识别拼音信息对应的候选输入信息包括:
确定对应所述地理位置信息的模糊音推荐词库,所述模糊音推荐词库用于存储地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息;
查看所述模糊音推荐词库中是否存在与所述待识别拼音信息对应的候选输入信息,若有,则显示该候选输入信息,否则,根据所述模糊音推荐词库对应的地理位置模糊音映射关系集合对所述待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找与所述地理位置修正拼音信息对应的候选输入信息,其中,地理位置模糊音映射关系用于表征地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息之间的对应关系。
6.根据权利要求5所述的方法,其特征在于,所述通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息还包括:
若无法从所述系统词库中查找到与所述地理位置修正拼音信息对应的候选输入信息,则将所述待识别拼音信息按照单个字输入信息进行拆分得到拼音单元信息,并从所述系统词库中查找与所述拼音单元信息对应的候选输入信息。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:
获取用户从所述候选输入信息中选定的输入信息,若该输入信息不在所述用户词库中,并且该输入信息对应的待识别拼音信息连续第一设定次数输入错误,则建立该输入信息和所述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到所述模糊音映射关系集合,并将该输入信息和所述待识别拼音信息加入所述用户词库。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
若所述输入信息属于所述用户词库,并且该输入信息对应的待识别拼音信息连续第二设定次数输入正确,则从所述用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从所述模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
9.一种用于识别拼音信息的装置,其特征在于,所述装置包括:
待识别拼音信息获取单元,用于获取用户通过终端输入的待识别拼音信息,所述待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;
候选输入信息获取单元,用于确定是否存在模糊音映射关系集合,若存在,则根据所述模糊音映射关系集合获取与所述待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与所述待识别拼音信息对应的候选输入信息,其中,所述模糊音映射关系用于表征用户的历史拼音信息与历史候选输入信息之间的对应关系,所述地理位置信息用于表征终端当前所在的地理位置。
10.根据权利要求9所述的装置,其特征在于,所述候选输入信息获取单元包括:
第一候选输入信息获取子单元,用于根据模糊音映射关系集合查找用户词库中是否存在与所述待识别拼音信息对应的候选输入信息,若存在,则显示该候选输入信息,否则,从系统词库中查找与所述待识别拼音信息对应的候选输入信息,所述用户词库用于存储用户的历史拼音信息和对应所述历史拼音信息的历史候选输入信息,所述系统词库用于存储与拼音信息对应的候选输入信息。
11.根据权利要求10所述的装置,其特征在于,所述第一候选输入信息获取子单元包括:
修正模块,用于通过模糊音映射关系集合对所述待识别拼音信息进行修正得到至少一个修正拼音信息;
第一查找模块,用于从所述系统词库中查找与所述至少一个修正拼音信息对应的至少一个候选输入信息,并显示该至少一个候选输入信息。
12.根据权利要求9所述的装置,其特征在于,所述候选输入信息获取单元包括:
第二候选输入信息获取子单元,用于查找系统词库中与所述待识别拼音信息对应的候选输入信息,确定所述候选输入信息的匹配度,若所述匹配度大于设定阈值,则显示该候选输入信息,否则,查看终端当前所在的地理位置信息,根据所述地理位置信息获取所述待识别拼音信息对应的候选输入信息,所述匹配度用于通过输入信息的使用频率来表征候选输入信息的准确度,所述系统词库用于存储与拼音信息对应的候选输入信息。
13.根据权利要求12所述的装置,其特征在于,所述第二候选输入信息获取子单元包括:
模糊音推荐词库确定模块,用于确定对应所述地理位置信息的模糊音推荐词库,所述模糊音推荐词库用于存储地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息;
第二查找模块,用于查看所述模糊音推荐词库中是否存在与所述待识别拼音信息对应的候选输入信息,若有,则显示该候选输入信息,否则,根据所述模糊音推荐词库对应的地理位置模糊音映射关系集合对所述待识别拼音信息进行修正得到地理位置修正拼音信息,从系统词库中查找与所述地理位置修正拼音信息对应的候选输入信息,其中,地理位置模糊音映射关系用于表征地理位置信息对应的拼音信息和对应该拼音信息的候选输入信息之间的对应关系。
14.根据权利要求13所述的装置,其特征在于,所述第二候选输入信息获取子单元还包括:
第三查找模块,用于在无法从所述系统词库中查找到与所述地理位置修正拼音信息对应的候选输入信息时,将所述待识别拼音信息按照单个字输入信息进行拆分得到拼音单元信息,并从所述系统词库中查找与所述拼音单元信息对应的候选输入信息。
15.根据权利要求9-14任意一项所述的装置,其特征在于,所述装置还包括:
第一更新单元,用于获取用户从所述候选输入信息中选定的输入信息,若该输入信息不在所述用户词库中,并且该输入信息对应的待识别拼音信息连续第一设定次数输入错误,则建立该输入信息和所述待识别拼音信息之间的模糊音映射关系,将该模糊音映射关系加入到所述模糊音映射关系集合,并将该输入信息和所述待识别拼音信息加入所述用户词库。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
第二更新单元,用于在所述输入信息属于所述用户词库,并且该输入信息对应的待识别拼音信息连续第二设定次数输入正确时,从所述用户词库中删除该输入信息和对应该输入信息的待识别拼音信息,并从所述模糊音映射关系集合中删除该输入信息和与该输入信息对应的待识别拼音信息之间的模糊音映射关系。
CN201610729886.2A 2016-08-25 2016-08-25 用于识别拼音信息的方法及装置 Pending CN106339105A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610729886.2A CN106339105A (zh) 2016-08-25 2016-08-25 用于识别拼音信息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610729886.2A CN106339105A (zh) 2016-08-25 2016-08-25 用于识别拼音信息的方法及装置

Publications (1)

Publication Number Publication Date
CN106339105A true CN106339105A (zh) 2017-01-18

Family

ID=57822180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610729886.2A Pending CN106339105A (zh) 2016-08-25 2016-08-25 用于识别拼音信息的方法及装置

Country Status (1)

Country Link
CN (1) CN106339105A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168553A (zh) * 2017-07-17 2017-09-15 北京百度网讯科技有限公司 用于输入字词的方法和输入法
CN109116996A (zh) * 2017-06-23 2019-01-01 百度在线网络技术(北京)有限公司 用于获取信息的方法、装置及服务器
CN109669549A (zh) * 2017-10-16 2019-04-23 北京搜狗科技发展有限公司 候选内容生成方法和装置、用于候选内容生成的装置
CN110021396A (zh) * 2017-07-12 2019-07-16 东软集团股份有限公司 医嘱录入方法及装置、存储介质、电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1936786A (zh) * 2005-09-23 2007-03-28 英华达(上海)电子有限公司 汉语拼音输入的模糊音输入法
CN101441527A (zh) * 2008-12-24 2009-05-27 腾讯科技(深圳)有限公司 拼音输入中提示正确读音的方法及装置
CN101876853A (zh) * 2009-04-29 2010-11-03 北京搜狗科技发展有限公司 拼音输入方法及装置
CN102478968A (zh) * 2010-11-23 2012-05-30 腾讯科技(深圳)有限公司 中文拼音输入方法和中文拼音输入系统
CN103064825A (zh) * 2011-10-18 2013-04-24 阿里巴巴集团控股有限公司 模糊音对建立、设置方法和输入法及其装置和系统
CN103455160A (zh) * 2012-05-29 2013-12-18 阿里巴巴集团控股有限公司 一种根据地理位置推荐候选词的方法和装置
CN105549760A (zh) * 2016-01-27 2016-05-04 百度在线网络技术(北京)有限公司 信息输入方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1936786A (zh) * 2005-09-23 2007-03-28 英华达(上海)电子有限公司 汉语拼音输入的模糊音输入法
CN101441527A (zh) * 2008-12-24 2009-05-27 腾讯科技(深圳)有限公司 拼音输入中提示正确读音的方法及装置
CN101876853A (zh) * 2009-04-29 2010-11-03 北京搜狗科技发展有限公司 拼音输入方法及装置
CN102478968A (zh) * 2010-11-23 2012-05-30 腾讯科技(深圳)有限公司 中文拼音输入方法和中文拼音输入系统
CN103064825A (zh) * 2011-10-18 2013-04-24 阿里巴巴集团控股有限公司 模糊音对建立、设置方法和输入法及其装置和系统
CN103455160A (zh) * 2012-05-29 2013-12-18 阿里巴巴集团控股有限公司 一种根据地理位置推荐候选词的方法和装置
CN105549760A (zh) * 2016-01-27 2016-05-04 百度在线网络技术(北京)有限公司 信息输入方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109116996A (zh) * 2017-06-23 2019-01-01 百度在线网络技术(北京)有限公司 用于获取信息的方法、装置及服务器
CN110021396A (zh) * 2017-07-12 2019-07-16 东软集团股份有限公司 医嘱录入方法及装置、存储介质、电子设备
CN107168553A (zh) * 2017-07-17 2017-09-15 北京百度网讯科技有限公司 用于输入字词的方法和输入法
CN107168553B (zh) * 2017-07-17 2020-10-27 北京百度网讯科技有限公司 用于输入字词的方法、设备、可读存储介质及输入法
CN109669549A (zh) * 2017-10-16 2019-04-23 北京搜狗科技发展有限公司 候选内容生成方法和装置、用于候选内容生成的装置

Similar Documents

Publication Publication Date Title
US9965547B2 (en) System and methods for automating trademark and service mark searches
US11373047B2 (en) Method, system, and computer program for artificial intelligence answer
CN107291783B (zh) 一种语义匹配方法及智能设备
US9460085B2 (en) Testing and training a question-answering system
CA2458138C (en) Methods and systems for language translation
CN104572072B (zh) 一种对基于mvc模式的程序的语言转换方法与设备
CN114757176B (zh) 一种获取目标意图识别模型的方法以及意图识别方法
CN111488468B (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN110162681B (zh) 文本识别、文本处理方法、装置、计算机设备和存储介质
CN106339105A (zh) 用于识别拼音信息的方法及装置
CN111310440A (zh) 文本的纠错方法、装置和系统
CN107807915B (zh) 基于纠错平台的纠错模型建立方法、装置、设备和介质
CN109256125B (zh) 语音的离线识别方法、装置与存储介质
CN114595686B (zh) 知识抽取方法、知识抽取模型的训练方法及装置
CN111209753B (zh) 一种实体命名识别方法及装置
CN110096599B (zh) 知识图谱的生成方法及装置
KR20200014047A (ko) 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
CN109558600A (zh) 翻译处理方法及装置
EP3079083A1 (en) Providing app store search results
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
CN116383234A (zh) 一种搜索语句生成方法、装置、计算机设备及存储介质
CN111126054A (zh) 确定相似文本的方法、装置、存储介质及电子设备
CN114492370B (zh) 网页识别方法、装置、电子设备和介质
US10372829B2 (en) Method and computer readable recording medium for providing translation using image

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170118

RJ01 Rejection of invention patent application after publication