CN104092514A - 一种编码方式的切换方法及装置 - Google Patents
一种编码方式的切换方法及装置 Download PDFInfo
- Publication number
- CN104092514A CN104092514A CN201410322903.1A CN201410322903A CN104092514A CN 104092514 A CN104092514 A CN 104092514A CN 201410322903 A CN201410322903 A CN 201410322903A CN 104092514 A CN104092514 A CN 104092514A
- Authority
- CN
- China
- Prior art keywords
- character code
- encoding mode
- character data
- char
- disorder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种编码方式的切换方法,包括:根据当前编码方式将获取的字符数据流转换为字符编码串;判断转换后的所述字符编码串中是否存在字符乱码;若判断的结果为是,则将所述当前编码方式切换为其他编码方式,以使所述其他编码方式适用于所述获取的字符数据流。本发明还公开了一种装置。可通过切换不同的编码方式,满足获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种编码方式的切换方法及装置。
背景技术
目前,可通过多种编码方式实现数据传输,通常客户端与服务端之间可协议数据字符串传输的编码方式,以使在数据进行传输后,客户端或服务端能够根据正确的编码方式进行解码。若客户端与服务端未协商好编码方式,或编码方式在协议层或其他层级中被去掉后,容易出现乱码现象,或字符串中包含非英文和数字字符时,默认的编码方式通常会无法解析非英文和数字字符,导致出现乱码,降低了用户体验。
发明内容
本发明实施例提供一种编码方式的切换方法。可通过切换不同的编码方式,满足获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
一方面,本发明的实施例提供了一种编码方式的切换方法,包括:
根据当前编码方式将获取的字符数据流转换为字符编码串;
判断转换后的所述字符编码串中是否存在字符乱码;
若判断的结果为是,则将所述当前编码方式切换为其他编码方式。
另一方面,本发明的实施例提供了一种装置,包括:
转换模块,用于根据当前编码方式将获取的字符数据流转换为字符编码串;
判断模块,用于判断所述转换模块转换后的所述字符编码串中是否存在字符乱码;
切换模块,用于当所述判断模块判断的结果为是时,则将所述当前编码方式切换为其他编码方式。
通过根据当前编码方式将获取的字符数据流转换为字符编码串,并且判断转换后的字符编码串中是否存在字符乱码,可确定当前编码方式是否为适合字符数据流的编码方式,若判断出存在字符乱码,则可通过将当前编码方式切换为其他编码方式,以将编码方式调整为适合获取字符数据流的编码方式,满足le获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明中的一种编码方式的切换方法的一种实施例的流程图;
图2是本发明中的一种编码方式的切换方法的另一种实施例的流程图;
图3是本发明中的一种装置的一种实施例的结构示意图;
图4是本发明中的一种装置的另一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中所提及装置及能够实现下述方法的装置可包括客户终端,如手机、平板电脑、机顶盒、智能电视;或服务端等能够进行数据编码的装置。以上所述装置均在本发明保护范围内。
下面参考附图对本发明的实施例进行描述。参见图1,为本发明中的一种编码方式的切换方法的一种实施例的流程图。
步骤S101,根据当前编码方式将获取的字符数据流转换为字符编码串。
本发明实施例中,可为客户端获取服务端发送的字符数据流,也可为服务端获取客户端发送的字符数据流,如机顶盒端获取前端发送的字符数据流;也可为当前模块从其他模块获取到字符数据流,如上层应用模块从代码底层模块获取到字符数据流。当获取到字符数据流后,可通过当前编码方式将获取的字符数据流转换为字符编码串,其中,当前编码方式可为默认的编码方式,默认编码方式的设置可包括设置使用范围最大的编码方式,或模块之间协商好的编码方式。编码方式可包括ASCII、GB2312、GBK、GB18030、BIG5、ISO-8859-1、UCS-2、UTF-8、UTF-16等多种编码方式。
步骤S102,判断转换后的所述字符编码串中是否存在字符乱码。
本发明实施例中,将获取到的字符数据流根据当前编码方式转换为字符编码串后,可判断字符编码串中是否存在字符乱码。可选的,可将字符编码串中的字符编码子串与当前编码方式对应的数据库中的字和词组进行比对,若在数据库中未查找到字符编码子串,则表明编码转换出的字符编码子串为乱码,不能被用户识别,则可判断出字符编码串中存在字符乱码。若在数据库中查找到字符编码串包含的所有字符编码子串,则表明字符编码串中不存在字符乱码。则表明当前编码方式适用于获取到的字符数据流,可记录当前编码方式,以便下次获取到字符数据流时,继续使用当前编码方式进行编码。
步骤S103,若在步骤S102中判断的结果为是,则将所述当前编码方式切换为其他编码方式,以使所述其他编码方式适用于所述获取的字符数据流。
本发明实施例中,当在步骤S102中判断出转换后的字符编码串中存在字符乱码,可选的,即字符编码串中的字符编码子串未在数据库中查找到对应的常用字或词组,则表明该字符编码子串为乱码,当前的编码方式不适用于获取到的字符数据流,则需将当前编码方式切换为其他编码方式,并重新对获取到的字符数据流进行编码转换,并重复进行步骤S102,从而筛选出编码转换后的字符编码串中不存在字符乱码的编码方式,即为适用于获取的字符数据流的编码方式。可选的,可记录筛选出的适用于字符数据流的编码方式,并可将其设置为默认的编码方式,以便在下一次获取字符数据流时,可根据上述设置的默认的编码方式对字符数据流进行编码转换。
通过根据当前编码方式将获取的字符数据流转换为字符编码串,并且判断转换后的字符编码串中是否存在字符乱码,可确定当前编码方式是否为适合字符数据流的编码方式,若判断出存在字符乱码,则可通过将当前编码方式切换为其他编码方式,以将编码方式调整为适合获取字符数据流的编码方式,满足了获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
参见图2,为本发明中的一种编码方式的切换方法的另一种实施例的流程图。
步骤S201,获取所述字符数据流。
本发明实施例中,可为客户端获取服务端发送的字符数据流,也可为服务端获取客户端发送的字符数据流,如机顶盒端获取前端发送的字符数据流;也可为当前模块从其他模块获取到字符数据流,如上层应用模块从代码底层模块获取到字符数据流。
步骤S202,记录获取所述字符数据流的时间或次数。
本发明实施例中,可通过设定定时器或计数器以启动编码方式的切换方法,当获取到字符数据流后,可记录获取到字符数据流的时间或次数,从而根据定时器或计数器设定的时间或设置的计数数值,可判断是否需要根据当前编码方式对获取的字符数据流进行转换。若记录当前获取字符数据流的时间或次数尚未达到预先设定的时间或计数数值,则表明无需对当前获取的字符数据流进行编码方式校验的工作,即无需进行下述步骤,仅以默认或记录的编码方式对当前获取的字符数据流进行编码转换,从而可优化系统性能,提高系统运作效率。
步骤S203,当所述记录的时间或次数超过预设的阈值时,根据所述当前编码方式将所述获取的字符数据流转换为所述字符编码串。
本发明实施例中,当在步骤S202中记录的时间或次数超过预设的阈值时,即超过定时器或计数器设定的时间或设置的计数数值时,则表明需要进行编码方式的识别,以确定当前编码方式是否适用于获取的字符数据流。则根据当前编码方式将获取的字符数据流转换为字符编码串,其中,当前编码方式可为默认的编码方式,默认编码方式的设置可包括设置使用范围最大的编码方式,或模块之间协商好的编码方式。编码方式可包括ASCII、GB2312、GBK、GB18030、BIG5、ISO-8859-1、UCS-2、UTF-8、UTF-16等多种编码方式。
步骤S204,在所述字符编码串中截取字符编码子串,其中,所述字符编码子串的长度为所述当前编码方式对应的编码长度。
本发明实施例中,根据当前编码方式将获取的字符数据流转换为字符编码串后,可在字符编码串中截取字符编码子串,从而可根据以下步骤分析每个字符编码子串是否为常用字或常用词组,即可判定字符编码串中是否存在字符乱码。其中,可根据不同的编码方式截取不同长度的编码子串,如当前编码方式为GB2313,则截取的字符编码子串的长度为2个字节。从而保证截取的字符编码子串不会被系统认作乱码。
步骤S205,在所述当前编码方式对应的字和/或词语数据库中,查询是否存在所述字符编码子串。
本发明实施例中,当获取字符编码子串后,可通过在当前编码方式对应的字和/或词语数据库中查找是否存在获取的字符编码子串,来确定所查询的字符编码子串是否为乱码,若在字和/或数据库中查找到相应的字符编码子串,则表明当前查询的字符编码子串不是字符乱码,则可继续截取下一个字符编码子串以进行查找,若未找到,则可确定为字符乱码。
本发明实施例中,可选的,除了可通过在数据库中进行查询,也可通过其他方式进行查询,如解析字符编码子串是否为常规组合形式等,其中,查找数据库的方式由于效率较高,为优选方案。数据库的建立或查询可通过sql server,mysql,oracle,access等。
步骤S206,若在步骤S205中查询的结果为否,则确定所述字符编码子串为所述字符乱码。
本发明实施例中,当在步骤S205中,未在字和/或词组的数据库中查找到当前截取的字符编码子串时,则表明字符编码子串未形成字或词组,可确定当前截取的字符编码子串为字符乱码。
步骤S207,记录所述字符编码串中所述字符乱码的个数。
本发明实施例中,可通过步骤S204-S206判定字符编码串中是否存在字符乱码,当通过以上步骤查询完字符编码串中包含的所有字符编码子串后,则可统计并记录字符编码串中查找出的字符乱码的个数。并可设定阈值,如果个数未超过设定阈值,则可能该字符乱码对应的字或词组较生僻,未被数据库收录,则可无需切换当前编码方式。
步骤S208,判断所述记录的字符乱码的个数与所述字符编码子串总数的比值是否超过预设阈值。
本发明实施例中,也可通过判断字符乱码在字符编码子串中所占的比例是否超过设定阈值,来判定是否需要切换编码方式。如预设的阈值为3%,截取的字符编码子串为100个,则查询出的字符乱码不超过3个,即表明无需进行编码方式切换,若超过,则表明当前编码方式不适用于当前获取的字符数据流,需进行编码方式切换。
步骤S209,若在步骤S208中判断的结果为是,则将所述当前编码方式切换为其他编码方式,以使所述其他编码方式适用于所述获取的字符数据流。
本发明实施例中,当在步骤S208中判断出字符乱码所占比例超过预设阈值时,将当前编码方式切换为其他方式。并重新对获取到的字符数据流进行编码转换,并重复步骤S204-S206对字符数据流进行字符乱码查询,从而筛选出编码转换后的字符编码串中不存在字符乱码的编码方式,即为适用于获取的字符数据流的编码方式。可选的,可记录筛选出的适用于字符数据流的编码方式,并可将其设置为默认的编码方式,以便在下一次获取字符数据流时,可根据上述设置的默认的编码方式对字符数据流进行编码转换。
步骤S210,若在步骤S208中判断的结果为否,则设置所述当前编码方式为默认编码方式,以使在下次获取所述字符数据流时,根据所述默认编码方式转换所述字符数据流。
本发明实施例中,若在步骤S208中判断字符乱码所占比例未超过预设阈值时,则表明当前编码方式适用于获取的字符数据流,则可将当前编码方式设置为默认编码方式。当下次获取字符数据流时,可根据设置的默认编码方式对字符数据流进行编码转换,从而节省了系统空间,提高了系统性能。
通过根据当前编码方式将获取的字符数据流转换为字符编码串,并且判断转换后的字符编码串中是否存在字符乱码,可确定当前编码方式是否为适合字符数据流的编码方式,若判断出存在字符乱码,则可通过将当前编码方式切换为其他编码方式,以将编码方式调整为适合获取字符数据流的编码方式,满足了获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
参见图3,为本发明中的一种装置的一种实施例的结构示意图。该装置可包括转换模块01、判断模块02、切换模块03。
其中,转换模块01,用于根据当前编码方式将获取的字符数据流转换为字符编码串。
本发明实施例中,可为客户端获取服务端发送的字符数据流,也可为服务端获取客户端发送的字符数据流,如机顶盒端获取前端发送的字符数据流;也可为当前模块从其他模块获取到字符数据流,如上层应用模块从代码底层模块获取到字符数据流。当获取到字符数据流后,转换模块01可通过当前编码方式将获取的字符数据流转换为字符编码串,其中,当前编码方式可为默认的编码方式,默认编码方式的设置可包括设置使用范围最大的编码方式,或模块之间协商好的编码方式。编码方式可包括ASCII、GB2312、GBK、GB18030、BIG5、ISO-8859-1、UCS-2、UTF-8、UTF-16等多种编码方式。
判断模块02,用于判断所述转换模块转换后的所述字符编码串中是否存在字符乱码。
本发明实施例中,转换模块01将获取到的字符数据流根据当前编码方式转换为字符编码串后,判断模块02可判断字符编码串中是否存在字符乱码。可选的,可将字符编码串中的字符编码子串与当前编码方式对应的数据库中的字和词组进行比对,若在数据库中未查找到字符编码子串,则表明编码转换出的字符编码子串为乱码,不能被用户识别,则可判断出字符编码串中存在字符乱码。若在数据库中查找到字符编码串包含的所有字符编码子串,则表明字符编码串中不存在字符乱码。则表明当前编码方式适用于获取到的字符数据流,可记录当前编码方式,以便下次获取到字符数据流时,继续使用当前编码方式进行编码。
切换模块03,用于当所述判断模块02判断的结果为是时,则将所述当前编码方式切换为其他编码方式。
本发明实施例中,当在判断模块02判断出转换后的字符编码串中存在字符乱码,可选的,即字符编码串中的字符编码子串未在数据库中查找到对应的常用字或词组,则表明该字符编码子串为乱码,当前的编码方式不适用于获取到的字符数据流,则切换模块03需将当前编码方式切换为其他编码方式,并重新对获取到的字符数据流进行编码转换,并重复进行步骤S102,从而筛选出编码转换后的字符编码串中不存在字符乱码的编码方式,即为适用于获取的字符数据流的编码方式。可选的,可记录筛选出的适用于字符数据流的编码方式,并可将其设置为默认的编码方式,以便在下一次获取字符数据流时,可根据上述设置的默认的编码方式对字符数据流进行编码转换。
通过根据当前编码方式将获取的字符数据流转换为字符编码串,并且判断转换后的字符编码串中是否存在字符乱码,可确定当前编码方式是否为适合字符数据流的编码方式,若判断出存在字符乱码,则可通过将当前编码方式切换为其他编码方式,以将编码方式调整为适合获取字符数据流的编码方式,满足了获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
参见图4,为本发明中的一种装置的另一种实施例的结构示意图。该装置可包括转换模块11、截取模块12、查询模块13、确定模块14、记录模块15、判断模块16、切换模块17、设置模块18。
其中,转换模块11,用于根据当前编码方式将获取的字符数据流转换为字符编码串。
本发明实施例中,转换模块11可包括获取单元111、记录单元112、转换单元113。
获取单元111,用于获取所述字符数据流。
本发明实施例中,获取单元111可为客户端获取服务端发送的字符数据流,也可为服务端获取客户端发送的字符数据流,如机顶盒端获取前端发送的字符数据流;也可为当前模块从其他模块获取到字符数据流,如上层应用模块从代码底层模块获取到字符数据流。
记录单元112,用于记录所述获取单元111获取所述字符数据流的时间或次数。
本发明实施例中,可通过设定定时器或计数器以启动编码方式的切换方法,当获取单元111获取到字符数据流后,记录单元112可记录获取到字符数据流的时间或次数,从而根据定时器或计数器设定的时间或设置的计数数值,可判断是否需要根据当前编码方式对获取的字符数据流进行转换。若记录当前获取字符数据流的时间或次数尚未达到预先设定的时间或计数数值,则表明无需对当前获取的字符数据流进行编码方式校验的工作,即无需进入下述单元,仅以默认或记录的编码方式对当前获取的字符数据流进行编码转换,从而可优化系统性能,提高系统运作效率。
转换单元113,用于当所述记录单元112记录的时间或次数超过预设的阈值时,根据所述当前编码方式将所述获取的字符数据流转换为所述字符编码串。
本发明实施例中,当在记录单元112记录的时间或次数超过预设的阈值时,即超过定时器或计数器设定的时间或设置的计数数值时,则表明需要进行编码方式的识别,以确定当前编码方式是否适用于获取的字符数据流。则转换单元113根据当前编码方式将获取的字符数据流转换为字符编码串,其中,当前编码方式可为默认的编码方式,默认编码方式的设置可包括设置使用范围最大的编码方式,或模块之间协商好的编码方式。编码方式可包括ASCII、GB2312、GBK、GB18030、BIG5、ISO-8859-1、UCS-2、UTF-8、UTF-16等多种编码方式。
截取模块12,用于在所述字符编码串中截取字符编码子串,其中,所述字符编码子串的长度为所述当前编码方式对应的编码长度。
本发明实施例中,转换模块11根据当前编码方式将获取的字符数据流转换为字符编码串后,截取模块12可在字符编码串中截取字符编码子串,从而可根据以下步骤分析每个字符编码子串是否为常用字或常用词组,即可判定字符编码串中是否存在字符乱码。其中,可根据不同的编码方式截取不同长度的编码子串,如当前编码方式为GB2313,则截取的字符编码子串的长度为2个字节。从而保证截取的字符编码子串不会被系统认作乱码。
查询模块13,用于在所述当前编码方式对应的字和/或词语数据库中,查询是否存在所述截取模块截取的所述字符编码子串。
本发明实施例中,当获取字符编码子串后,查询模块13可通过在当前编码方式对应的字和/或词语数据库中查找是否存在获取的字符编码子串,来确定所查询的字符编码子串是否为乱码,若在字和/或数据库中查找到相应的字符编码子串,则表明当前查询的字符编码子串不是字符乱码,则可继续截取下一个字符编码子串以进行查找,若未找到,则可确定为字符乱码。
本发明实施例中,可选的,除了可通过在数据库中进行查询,也可通过其他方式进行查询,如解析字符编码子串是否为常规组合形式等,其中,查找数据库的方式由于效率较高,为优选方案。数据库的建立或查询可通过sql server,mysql,oracle,access等。
确定模块14,用于当所述查询模块13查询的结果为否时,确定所述字符编码子串为所述字符乱码。
本发明实施例中,当查询模块13未在字和/或词组的数据库中查找到当前截取的字符编码子串时,则表明字符编码子串未形成字或词组,确定模块14可确定当前截取的字符编码子串为字符乱码。
记录模块15,用于在所述确定模块确定所述字符编码子串为所述字符乱码之后,记录所述字符编码串中所述字符乱码的个数。
本发明实施例中,可通过截取模块12、查询模块13、确定模块14判定字符编码串中是否存在字符乱码,当通过以上模块查询完字符编码串中包含的所有字符编码子串后,则记录模块15可统计并记录字符编码串中查找出的字符乱码的个数。并可设定阈值,如果个数未超过设定阈值,则可能该字符乱码对应的字或词组较生僻,未被数据库收录,则可无需切换当前编码方式。
判断模块16,判断所述个数记录模块记录的字符乱码的个数与所述字符编码子串总数的比值是否超过预设阈值。
本发明实施例中,判断模块16也可通过判断字符乱码在字符编码子串中所占的比例是否超过设定阈值,来判定是否需要切换编码方式。如预设的阈值为3%,截取的字符编码子串为100个,则查询出的字符乱码不超过3个,即表明无需进行编码方式切换,若超过,则表明当前编码方式不适用于当前获取的字符数据流,需进行编码方式切换。
切换模块17,用于当所述判断模块16判断的结果为是时,则将所述当前编码方式切换为其他编码方式。
本发明实施例中,当在判断模块16判断出字符乱码所占比例超过预设阈值时,切换模块17将当前编码方式切换为其他方式。并重新对获取到的字符数据流进行编码转换,并重复对字符数据流进行字符乱码查询,从而筛选出编码转换后的字符编码串中不存在字符乱码的编码方式,即为适用于获取的字符数据流的编码方式。可选的,可记录筛选出的适用于字符数据流的编码方式,并可将其设置为默认的编码方式,以便在下一次获取字符数据流时,可根据上述设置的默认的编码方式对字符数据流进行编码转换。
设置模块18,用于当所述判断模块16判断的结果为否时,设置所述当前编码方式为默认编码方式,以使在下次获取所述字符数据流时,根据所述默认编码方式转换所述字符数据流。
本发明实施例中,若在判断模块16中判断字符乱码所占比例未超过预设阈值时,则表明当前编码方式适用于获取的字符数据流,则设置模块18可将当前编码方式设置为默认编码方式。当下次获取字符数据流时,可根据设置的默认编码方式对字符数据流进行编码转换,从而节省了系统空间,提高了系统性能。
通过根据当前编码方式将获取的字符数据流转换为字符编码串,并且判断转换后的字符编码串中是否存在字符乱码,可确定当前编码方式是否为适合字符数据流的编码方式,若判断出存在字符乱码,则可通过将当前编码方式切换为其他编码方式,以将编码方式调整为适合获取字符数据流的编码方式,满足了获取的不同字符数据流对编码方式的需求,降低编码过程中出现乱码的概率,提升用户体验。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。
Claims (10)
1.一种编码方式的切换方法,其特征在于,包括:
根据当前编码方式将获取的字符数据流转换为字符编码串;
判断转换后的所述字符编码串中是否存在字符乱码;
若判断的结果为是,则将所述当前编码方式切换为其他编码方式,以使所述其他编码方式适用于所述获取的字符数据流。
2.如权利要求1所述方法,其特征在于,所述根据当前编码方式将获取的字符数据流转换为字符编码串,包括:
获取所述字符数据流;
记录获取所述字符数据流的时间或次数;
当所述记录的时间或次数超过预设的阈值时,根据所述当前编码方式将所述获取的字符数据流转换为所述字符编码串。
3.如权利要求1或2所述方法,其特征在于,在所述判断转换后的所述字符编码串中是否存在字符乱码之前,所述方法还包括:
在所述字符编码串中截取字符编码子串,其中,所述字符编码子串的长度为所述当前编码方式对应的编码长度;
在所述当前编码方式对应的字和/或词语数据库中,查询是否存在所述字符编码子串;
若查询的结果为否,则确定所述字符编码子串为所述字符乱码。
4.如权利要求3所述方法,其特征在于,在所述若查询的结果为否,则确定所述字符编码子串为所述字符乱码之后,所述方法还包括:
记录所述字符编码串中所述字符乱码的个数;
其中,所述判断转换后的所述字符编码串中是否存在字符乱码,包括:
判断所述记录的字符乱码的个数与所述字符编码子串总数的比值是否超过预设阈值。
5.如权利要求4所述方法,其特征在于,在所述若判断的结果为是,则将所述当前编码方式切换为其他编码方式,以使所述其他编码方式适用于所述获取的字符数据流之后,所述方法还包括:
若判断的结果为否,则设置所述当前编码方式为默认编码方式,以使在下次获取所述字符数据流时,根据所述默认编码方式转换所述字符数据流。
6.一种装置,其特征在于,包括:
转换模块,用于根据当前编码方式将获取的字符数据流转换为字符编码串;
判断模块,用于判断所述转换模块转换后的所述字符编码串中是否存在字符乱码;
切换模块,用于当所述判断模块判断的结果为是时,则将所述当前编码方式切换为其他编码方式。
7.如权利要求6所述装置,其特征在于,所述转换模块包括:
获取单元,用于获取所述字符数据流;
记录单元,用于记录所述获取单元获取所述字符数据流的时间或次数;
转换单元,用于当所述记录单元记录的时间或次数超过预设的阈值时,根据所述当前编码方式将所述获取的字符数据流转换为所述字符编码串。
8.如权利要求6或7所述装置,其特征在于,所述装置还包括:
截取模块,用于在所述判断模块判断转换后的所述字符编码串中是否存在字符乱码之前,在所述字符编码串中截取字符编码子串,其中,所述字符编码子串的长度为所述当前编码方式对应的编码长度;
查询模块,用于在所述当前编码方式对应的字和/或词语数据库中,查询是否存在所述截取模块截取的所述字符编码子串;
确定模块,用于当所述查询模块查询的结果为否时,确定所述字符编码子串为所述字符乱码。
9.如权利要求8所述装置,其特征在于,所述装置还包括:
记录模块,用于在所述确定模块确定所述字符编码子串为所述字符乱码之后,记录所述字符编码串中所述字符乱码的个数;
其中,所述判断模块还用于判断所述个数记录模块记录的字符乱码的个数与所述字符编码子串总数的比值是否超过预设阈值。
10.如权利要求4所述装置,其特征在于,所述装置还包括:
设置模块,用于当所述判断模块判断的结果为否时,设置所述当前编码方式为默认编码方式,以使在下次获取所述字符数据流时,根据所述默认编码方式转换所述字符数据流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410322903.1A CN104092514A (zh) | 2014-07-08 | 2014-07-08 | 一种编码方式的切换方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410322903.1A CN104092514A (zh) | 2014-07-08 | 2014-07-08 | 一种编码方式的切换方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104092514A true CN104092514A (zh) | 2014-10-08 |
Family
ID=51640198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410322903.1A Pending CN104092514A (zh) | 2014-07-08 | 2014-07-08 | 一种编码方式的切换方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104092514A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104661075A (zh) * | 2015-02-04 | 2015-05-27 | 深圳创维数字技术有限公司 | 一种数据处理方法及数字电视接收终端 |
CN106802882A (zh) * | 2016-12-29 | 2017-06-06 | 杭州迪普科技股份有限公司 | 一种检测命令行界面编码方式的方法及装置 |
CN110728115A (zh) * | 2018-07-17 | 2020-01-24 | 珠海金山办公软件有限公司 | 文档内容的乱码识别方法、装置及电子设备 |
CN110834498A (zh) * | 2019-11-28 | 2020-02-25 | 山东省科学院自动化研究所 | 一种单天线综合车身控制系统及无线通讯方法 |
CN117391070A (zh) * | 2023-12-08 | 2024-01-12 | 和元达信息科技有限公司 | 一种乱码字符调整方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1852520A (zh) * | 2005-08-01 | 2006-10-25 | 深圳华为移动通信技术有限公司 | 移动终端及其短信解码的方法 |
CN101101606A (zh) * | 2007-08-03 | 2008-01-09 | 中兴通讯股份有限公司 | 用于嵌入式浏览器的网页编码语言自动识别方法及装置 |
CN101110072A (zh) * | 2007-08-21 | 2008-01-23 | 无敌科技(西安)有限公司 | 一种自动辨识文字编码的装置及其方法 |
CN101350858A (zh) * | 2008-09-10 | 2009-01-21 | 深圳华为通信技术有限公司 | 一种短信解码的方法和用户终端 |
-
2014
- 2014-07-08 CN CN201410322903.1A patent/CN104092514A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1852520A (zh) * | 2005-08-01 | 2006-10-25 | 深圳华为移动通信技术有限公司 | 移动终端及其短信解码的方法 |
CN101101606A (zh) * | 2007-08-03 | 2008-01-09 | 中兴通讯股份有限公司 | 用于嵌入式浏览器的网页编码语言自动识别方法及装置 |
CN101110072A (zh) * | 2007-08-21 | 2008-01-23 | 无敌科技(西安)有限公司 | 一种自动辨识文字编码的装置及其方法 |
CN101350858A (zh) * | 2008-09-10 | 2009-01-21 | 深圳华为通信技术有限公司 | 一种短信解码的方法和用户终端 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104661075A (zh) * | 2015-02-04 | 2015-05-27 | 深圳创维数字技术有限公司 | 一种数据处理方法及数字电视接收终端 |
CN104661075B (zh) * | 2015-02-04 | 2018-07-03 | 深圳创维数字技术有限公司 | 一种数据处理方法及数字电视接收终端 |
CN106802882A (zh) * | 2016-12-29 | 2017-06-06 | 杭州迪普科技股份有限公司 | 一种检测命令行界面编码方式的方法及装置 |
CN110728115A (zh) * | 2018-07-17 | 2020-01-24 | 珠海金山办公软件有限公司 | 文档内容的乱码识别方法、装置及电子设备 |
CN110728115B (zh) * | 2018-07-17 | 2024-01-26 | 珠海金山办公软件有限公司 | 文档内容的乱码识别方法、装置及电子设备 |
CN110834498A (zh) * | 2019-11-28 | 2020-02-25 | 山东省科学院自动化研究所 | 一种单天线综合车身控制系统及无线通讯方法 |
CN117391070A (zh) * | 2023-12-08 | 2024-01-12 | 和元达信息科技有限公司 | 一种乱码字符调整方法及系统 |
CN117391070B (zh) * | 2023-12-08 | 2024-03-22 | 和元达信息科技有限公司 | 一种乱码字符调整方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104092514A (zh) | 一种编码方式的切换方法及装置 | |
CN109343963B (zh) | 一种容器集群的应用访问方法、装置及相关设备 | |
CN104539750A (zh) | 一种ip定位方法和装置 | |
CN109756584B (zh) | 域名解析方法、域名解析装置及计算机可读存储介质 | |
CN103618733A (zh) | 一种应用于移动互联网的数据过滤系统及方法 | |
CN103731516A (zh) | 基于嵌套视图的dns解析方法及其系统 | |
KR20160147927A (ko) | 모바일 네트워크의 용량 확장 최적화 | |
CN111061681A (zh) | 一种基于大小写不敏感的目录分片方法、装置及存储介质 | |
CN106844389B (zh) | 网络资源地址url的处理方法和装置 | |
CN111414361A (zh) | 标签数据存储方法、装置、设备及可读存储介质 | |
CN102882988A (zh) | 一种获得资源信息的地址信息的方法、装置及设备 | |
CN102170631B (zh) | 业务信息获取方法、设备和系统 | |
CN108959294B (zh) | 一种访问搜索引擎的方法和装置 | |
CN113254480B (zh) | 一种数据查询方法及装置 | |
CN107277095B (zh) | 会话分割方法及装置 | |
CN111666278B (zh) | 数据存储、检索方法、电子设备及存储介质 | |
CN106776617B (zh) | 日志文件的保存方法和装置 | |
US10775966B2 (en) | Customizable autocomplete option | |
CN110888733B (zh) | 集群资源使用情况处理方法、装置及电子设备 | |
CN116595106A (zh) | 一种用户分群方法、设备及存储介质 | |
CN104951571A (zh) | 图书借阅信息查阅方法以及系统 | |
CN112100168A (zh) | 一种确定数据关联关系的方法和装置 | |
CN104537078B (zh) | 一种基于滑块的目录索引优化方法 | |
CN103139207B (zh) | 解码方法和装置、报文解析方法和装置以及解析设备 | |
CN102104853A (zh) | 基于移动终端网页数据业务的服务器系统及其业务通信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20141008 |
|
WD01 | Invention patent application deemed withdrawn after publication |