CN102566768B - 一种对字符自动判断修正的方法及系统 - Google Patents

一种对字符自动判断修正的方法及系统 Download PDF

Info

Publication number
CN102566768B
CN102566768B CN201010592102.9A CN201010592102A CN102566768B CN 102566768 B CN102566768 B CN 102566768B CN 201010592102 A CN201010592102 A CN 201010592102A CN 102566768 B CN102566768 B CN 102566768B
Authority
CN
China
Prior art keywords
information
character
correction
visited
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010592102.9A
Other languages
English (en)
Other versions
CN102566768A (zh
Inventor
卢智昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201010592102.9A priority Critical patent/CN102566768B/zh
Publication of CN102566768A publication Critical patent/CN102566768A/zh
Application granted granted Critical
Publication of CN102566768B publication Critical patent/CN102566768B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种对字符自动判断修正的方法,该方法包括:捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配,将相匹配的信息判断为待处理信息,将待处理信息中的中文字符修正为对应的英文字符。本发明还公开了一种对字符自动判断修正的系统,系统中的修正单元,用于将待处理信息中的中文字符修正为对应的英文字符。采用本发明的方法及系统,能对输入错误的中英文字符进行自动判断修改,适用于中英文字符输入错误导致的无法实现对待访问网址访问的场景。

Description

一种对字符自动判断修正的方法及系统
技术领域
本发明涉及字符修正技术,尤其涉及一种对用户输入的中英文字符类的字符自动判断修正的方法及系统。
背景技术
如图1所示为现有技术字符输入错误的场景一,是在浏览器中输入待访问网址的情况。图1中在开启中文输入法状态下在浏览器地址栏输入待访问网址时很可能输入中文的字符“。”,而非英文的字符“.”,从而导致浏览器将该待访问网址判断为无法访问而进行搜索,可以通过如图2所示的百度搜索进行,虽然经过搜索的结果是一般也能正确显示出该待访问网址,但是在误判和执行搜索的过程中会浪费系统资源。如图3所示为现有技术字符输入错误的场景二,是在即时通讯(IM)客户端输入待访问网址的情况。图3中在开启中文输入法状态下本地客户端向对端客户端发送即时消息时,如果在本地客户端文本输入栏输入待访问网址,也很可能输入中文的字符“。”,而非英文的字符“.”,则导致的结果是:对端客户端接收到即时消息后,在对端客户端文本接收栏会显示字符输入错误的待访问网址,如图4所示,从而对端客户端也需要重新搜索待访问网址或是手动将中文的字符“。”修改为英文的字符“.”,才能实现对待访问网址的访问,而在执行搜索或手动修改的过程中也会浪费系统资源。当然其他场景,比如类似IM客户端的其他输入端或文字编辑软件客户端在应用时也会出现上述中英文字符输入错误,导致无法实现对待访问网址访问的问题,即便能通过搜索或手动修改实现,也会浪费系统资源。然而,现有的字符修正技术通常仅适用于word英文首字自动大写、搜索并自动替换关键词、敏感词自动过滤替换等场景。对上述中英文字符输入错误导致的无法实现对待访问网址访问的场景无法发挥作用,目前迫切需要一种字符自动判断修正方案,能适用于上述中英文字符输入错误导致的无法实现对待访问网址访问的场景。
发明内容
有鉴于此,本发明的主要目的在于提供一种对字符自动判断修正的方法及系统,能对输入错误的中英文字符进行自动判断修改,适用于中英文字符输入错误导致的无法实现对待访问网址访问的场景。
为达到上述目的,本发明的技术方案是这样实现的:
一种对字符自动判断修正的方法,该方法包括:捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配,将相匹配的信息判断为待处理信息,将所述待处理信息中的中文字符修正为对应的英文字符。
其中,该方法还包括:
执行所述匹配前,如果用户输入的信息为待访问网址,则开启修正执行切换开关,在所述修正执行切换开关处于开启状态下,执行所述匹配后执行所述判断及所述修正;或者,
执行所述匹配前,如果用户输入的信息为除所述待访问网址之外的内容,则关闭所述修正执行切换开关,在所述修正执行切换开关处于关闭状态下,不会执行所述匹配。
其中,用户输入的信息为所述待访问网址时,所述匹配具体包括:将所述待访问网址与修正配置中的域名信息进行匹配。
其中,所述判断及所述修正具体包括:将与所述域名信息相匹配的待访问网址判断为合法的网址信息进行修正处理,将待访问网址中的中文字符“。”修改为对应的英文字符“.”。
一种对字符自动判断修正的系统,该系统包括:判断单元和修正单元;其中,
所述判断单元,用于在捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配的情况下,将相匹配的信息判断为待处理信息;
所述修正单元,用于将所述待处理信息中的中文字符修正为对应的英文字符。
其中,该系统还包括匹配单元,用于在用户输入的信息为待访问网址的情况下,将所述待访问网址与修正配置中的域名信息进行匹配。
其中,所述判断单元,进一步用于将与所述域名信息相匹配的待访问网址判断为合法的网址信息;
所述修正单元,进一步用于将待访问网址中的中文字符“。”修改为对应的英文字符“.”。
本发明捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配,将相匹配的信息判断为待处理信息,将待处理信息中的中文字符修正为对应的英文字符。
采用本发明,通过将用户输入的信息与修正配置中的信息匹配,将相匹配的信息判断为待处理信息,能将待处理信息中的中文字符自动修正为对应的英文字符,从而能对输入错误的中英文字符进行自动判断修改,适用于中英文字符输入错误导致的无法实现对待访问网址访问的场景。
附图说明
图1为现有技术字符输入错误场景一的示意图;
图2为图1的搜索正确结果的示意图;
图3为现有技术字符输入错误场景二的示意图;
图4为图3的接收输入错误字符的示意图;
图5为本发明方法的实现流程示意图。
具体实施方式
本发明的基本思想是:捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配,将相匹配的信息判断为待处理信息,将待处理信息中的中文字符修正为对应的英文字符。
为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照附图,对本发明进一步详细说明。
一种对字符自动判断修正的方法,该方法主要包括以下内容:
一、捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配,将相匹配的信息判断为待处理信息。
这里,该方法还包括:执行所述匹配前,如果用户输入的信息为待访问网址,则开启修正执行切换开关,在修正执行切换开关处于开启状态下,执行所述匹配后执行所述判断及所述修正;或者,执行所述匹配前,如果用户输入的信息为除待访问网址之外的内容,则关闭修正执行切换开关,在修正执行切换开关处于关闭状态下,不会执行所述匹配。需要指出的是,设置修正执行切换开关的好处是:可以防止有特殊的输入情况出现,例如拟写教案,法规,举例等情况,不会将用户输入内容中所有涉及中英文切换的内容都进行自动修正,否则会有错误出现,本发明的自动修正是针对用户输入内容为待访问网址而言的,因此,为了对上述特殊的输入情况不进行自动修正,本发明可以设置有修正执行切换开关。
这里,用户输入的信息为待访问网址时,所述匹配具体包括:将待访问网址与修正配置中的域名信息进行匹配。所述判断及所述修正具体包括:将与域名信息相匹配的待访问网址判断为合法的网址信息进行修正处理,将待访问网址中的中文字符“。”修改为对应的英文字符“.”。
其中,执行所述匹配时,判断待访问网址是否为合法的网址信息的依据可以为以下任意一种条件或两种条件的结合:
条件1:待访问网址的开头带“http://”或“www.”。
条件2:待访问网址的结尾包含国际域名结尾。(国际域名结尾可以参考2010.0913的http://www.wikipedia.org/),比如国际域名结尾通常包括“.com”、或“.cn”、“.net”、“.com.cn”、“.org”、“org.cn”、“gov.cn”或“edu.cn”。
二、将待处理信息中的中文字符自动修正为对应的英文字符。用户输入内容中的中英文字符,涵盖所有软硬件中涉及的用户中英文字符输入的范围。
这里,用户输入的信息为待访问网址时,所述自动修正具体包括:将判断为合法的网址信息的连续文字范围内的中文字符“。”自动修正为对应的英文字符“.”。
其中,执行所述自动修正时,采用的方式为以下任意一种:
方式1:字符的文本模式匹配。具体的,将选中的连续文字范围内的字符与存储在内部数据库中的文本模式匹配,文本模式默认为英文模式,如果选中的连续文字范围内的字符包括非英文模式的中文字符“。”,则默认按照英文模式将中文字符“。”修改为对应的英文字符“.”。
方式2:字符对应ASCII编码值的替换。具体的,该方式基于ASCII码,如果选中的连续文字范围内的字符包括中文字符“。”,则用英文字符“.”对应的ASCII编码值替换掉用户输入的中文字符“。”对应的ASCII编码值,由于ASCII编码值自动替换了,因此,最终得到的替换结果为英文字符“.”
这里需要指出的是:执行所述自动修正时,无论采用上述那种方式,都可以要么对连续文字范围内包括的中文字符“。”,按照出现的顺序依次自动修正,或者,标记上连续文字范围内包括的所有中文字符“。”,最终一起批量自动修正。
综上所述,本发明可将浏览器地址栏或IM聊天工具等输入客户端由于中文输入法导致的输入错误的中文字符“。”自动修正为英文字符“.”,即:自动识别带“http://”或“www.”开头或结尾包含国际域名结尾类别的(如常见的“.com”,“.cn”,“.org”)连续文字串由于开启中文输入法输入错误的中文字符“。”自动修正为英文字符“.”。采用本发明的有益效果是:缩短用户获取待访问网址信息及修改待访问网址信息的时间,为错误的待访问网址信息的修改提供便利,避免像现有技术那样执行搜索或手动修改的过程中浪费系统资源,出现中英文字符输入错误能自动修正,从而不会导致无法实现对待访问网址访问的问题,也不会浪费系统资源。
方法实施例:
如图5所示,本实施例包括以下步骤:
步骤101、捕获用户输入操作。
这里,用户输入操作包括单个或输入法联想词组字母的输入操作,以及复制粘贴的输入操作。
步骤102、将在输入区域输入的连续文字串与修正配置中的域名信息相匹配,将与域名信息相匹配的待访问网址判断为合法的网址信息,以便进行修正处理。
这里,本步骤在匹配及判断时,是为了自动识别出输入的连续文字串是否属于网址,比如根据带“http://”或“www.”开头或结尾包含国际域名结尾类别的(如常见的“.com”,“.cn”,“.org”)判断。
步骤103、将输入的连续文字串中由中文输入法产生的中文字符“。”自动修正为对应的英文字符“.”。
一种对字符自动判断修正的系统,该系统包括:判断单元和修正单元;其中,判断单元用于在捕获用户在中文输入法状态下的输入操作,将用户输入的信息与修正配置中的信息匹配的情况下,将相匹配的信息判断为待处理信息。修正单元用于将待处理信息中的中文字符修正为对应的英文字符。
这里,该系统还包括匹配单元,匹配单元用于在用户输入的信息为待访问网址的情况下,将待访问网址与修正配置中的域名信息进行匹配。
这里,判断单元进一步用于将与域名信息相匹配的待访问网址判断为合法的网址信息。修正单元进一步用于将待访问网址中的中文字符“。”修改为对应的英文字符“.”。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (2)

1.一种对字符自动判断修正的方法,其特征在于,该方法包括:
设置修正执行切换开关;
捕获用户在中文输入法状态下的输入操作;
如果用户输入的信息为待访问网址,则开启修正执行切换开关,或者,
如果用户输入的信息为除所述待访问网址之外的内容,则关闭所述修正执行切换开关;
将用户输入的信息与修正配置中的域名信息匹配,将与域名信息相匹配的信息判断为待处理信息;
将所述待处理信息中的中文字符“。”根据字符的文本模式匹配或字符对应ASCII编码值替换的方式按照出现的顺序依次自动修正为对应的英文字符“.”;或者,标记上连续文字范围内包括的所有中文字符“。”,最终一起批量自动修正为对应的英文字符“.”。
2.一种对字符自动判断修正的系统,其特征在于,该系统包括:设置单元、判断单元和修正单元;其中,
所述设置单元,用于设置修正执行切换开关;
所述判断单元,用于在捕获用户在中文输入法状态下的输入操作的情况下,判断出用户输入的信息为待访问网址,则开启修正执行切换开关,或者,判断出用户输入的信息为除所述待访问网址之外的内容,则关闭所述修正执行切换开关;之后将用户输入的信息与修正配置中的域名信息匹配,将与域名信息相匹配的信息判断为待处理信息;
所述修正单元,用于将所述待处理信息中的中文字符“。”根据字符的文本模式匹配或字符对应ASCII编码值替换的方式按照出现的顺序依次自动修正为对应的英文字符“.”;或者,标记上连续文字范围内包括的所有中文字符“。”,最终一起批量自动修正为对应的英文字符“.”。
CN201010592102.9A 2010-12-13 2010-12-13 一种对字符自动判断修正的方法及系统 Active CN102566768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010592102.9A CN102566768B (zh) 2010-12-13 2010-12-13 一种对字符自动判断修正的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010592102.9A CN102566768B (zh) 2010-12-13 2010-12-13 一种对字符自动判断修正的方法及系统

Publications (2)

Publication Number Publication Date
CN102566768A CN102566768A (zh) 2012-07-11
CN102566768B true CN102566768B (zh) 2015-06-17

Family

ID=46412346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010592102.9A Active CN102566768B (zh) 2010-12-13 2010-12-13 一种对字符自动判断修正的方法及系统

Country Status (1)

Country Link
CN (1) CN102566768B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123125A (zh) * 2013-04-26 2014-10-29 腾讯科技(深圳)有限公司 网页资源的获取方法及装置
CN105306462B (zh) * 2015-10-13 2018-09-14 郑州悉知信息科技股份有限公司 网页链接检测方法及装置
CN105608064A (zh) * 2015-11-24 2016-05-25 小米科技有限责任公司 字符替换方法及装置
CN110020244B (zh) * 2017-11-03 2022-10-04 北京搜狗科技发展有限公司 一种对网址信息进行纠错的方法及装置
JP6372947B1 (ja) * 2018-05-14 2018-08-15 Jeインターナショナル株式会社 チャットシステム、チャット方法、およびプログラム
CN108763404A (zh) * 2018-05-22 2018-11-06 深圳市茁壮网络股份有限公司 一种访问地址容错方法及容错装置
CN109063106B (zh) * 2018-07-27 2022-03-04 北京字节跳动网络技术有限公司 网址修正方法、装置、计算机设备和存储介质
CN111310460B (zh) * 2018-12-12 2022-03-01 Tcl科技集团股份有限公司 语句的调整方法及装置
CN113157731A (zh) * 2021-05-24 2021-07-23 北京字节跳动网络技术有限公司 符号解析方法、装置、设备及存储介质
CN114089980A (zh) * 2022-01-18 2022-02-25 北京大学 编程处理方法、装置、解释器及非易失性存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255669A (zh) * 1999-12-23 2000-06-07 廖恒毅 一种计算机中英文混和输入的中英文切换方案
WO2000046696A2 (en) * 1999-02-02 2000-08-10 Telefonaktiebolaget Lm Ericsson (Publ) Addressing in the internet
CN1641546A (zh) * 2004-01-09 2005-07-20 顺德市顺达电脑厂有限公司 网址输入方法
CN1945501A (zh) * 2006-10-20 2007-04-11 魏新成 地址搜索栏输入检索字符串对中文域名进行在线检索操作
CN101140595A (zh) * 2007-10-31 2008-03-12 北京搜狗科技发展有限公司 一种网络资源地址输入的方法和一种输入法系统
CN101477540A (zh) * 2009-01-21 2009-07-08 佛朗索瓦·卢克·科利侬 一种用于url重写的方法和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050235031A1 (en) * 1999-09-10 2005-10-20 Eric Schneider Hyperlink generation and enhanced spell check method, product, apparatus, and user interface system
US20090063406A1 (en) * 2007-08-27 2009-03-05 Amit Golander Method, Service and Search System for Network Resource Address Repair

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000046696A2 (en) * 1999-02-02 2000-08-10 Telefonaktiebolaget Lm Ericsson (Publ) Addressing in the internet
CN1255669A (zh) * 1999-12-23 2000-06-07 廖恒毅 一种计算机中英文混和输入的中英文切换方案
CN1641546A (zh) * 2004-01-09 2005-07-20 顺德市顺达电脑厂有限公司 网址输入方法
CN1945501A (zh) * 2006-10-20 2007-04-11 魏新成 地址搜索栏输入检索字符串对中文域名进行在线检索操作
CN101140595A (zh) * 2007-10-31 2008-03-12 北京搜狗科技发展有限公司 一种网络资源地址输入的方法和一种输入法系统
CN101477540A (zh) * 2009-01-21 2009-07-08 佛朗索瓦·卢克·科利侬 一种用于url重写的方法和设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
URL重写技术及在国内外授权访问系统中的应用研究;高旻等;《现代情报》;20080725(第7期);126-128 *
姜旭平.2.2.1 网上信息资源的分类规定.《网络营销》.清华大学出版社,2003,23-25. *
董安妮.手写输入 动画皮肤:搜狗输入法5.0试用.《网络与信息》.2010,(第5期), *

Also Published As

Publication number Publication date
CN102566768A (zh) 2012-07-11

Similar Documents

Publication Publication Date Title
CN102566768B (zh) 一种对字符自动判断修正的方法及系统
CN110348201B (zh) 一种设备安全策略的配置方法及装置
JP4395848B2 (ja) 廃棄可能なeメールアドレスを生成し、処理するための方法、システム、及びコンピュータ・プログラム
CN103338208B (zh) 一种sql注入防御的方法和系统
US20080256187A1 (en) Method and System for Filtering Electronic Messages
CN104462509A (zh) 垃圾评论检测方法及装置
CN102694772A (zh) 一种访问互联网网页的装置、系统及方法
CN103825895A (zh) 一种信息处理方法及电子设备
CN102456063A (zh) 一种网页访问错误修正的方法及其系统
CN104123125A (zh) 网页资源的获取方法及装置
CN103368977A (zh) 网络连接方法及终端设备
CN102893576A (zh) 用于减缓跨站弱点的方法和装置
CN106169995B (zh) 一种直播网站手机绑定短信验证防刷方法及系统
CN107301347A (zh) 一种基于静态分析获取Hbuilder App调用图的方法
CN108830082B (zh) 一种基于输出点位置的xss漏洞检测参数自动选取方法
CN104765784A (zh) 关键词列表维护方法及系统
JP2009259230A (ja) 情報サービス提供方法およびサーバ
CN106921894A (zh) 一种机顶盒浏览器页面初始焦点的查找方法及系统
CN102681996B (zh) 预读方法和装置
WO2014187182A1 (en) Method, apparatus and system for controlling address input
CN103227815B (zh) 控制浏览器缓存的方法及装置
CN104811418A (zh) 病毒检测的方法及装置
CN104023124A (zh) 自动识别和提取短信中姓名的方法及装置
CN106648946A (zh) 基于插桩方式快速屏蔽客户端故障的方法及系统
CN103413092A (zh) 一种网络终端禁止恶意代码注入的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant