CN106484662A - 一种混合数据排序方法和装置 - Google Patents

一种混合数据排序方法和装置 Download PDF

Info

Publication number
CN106484662A
CN106484662A CN201610890027.1A CN201610890027A CN106484662A CN 106484662 A CN106484662 A CN 106484662A CN 201610890027 A CN201610890027 A CN 201610890027A CN 106484662 A CN106484662 A CN 106484662A
Authority
CN
China
Prior art keywords
pending data
data
digit
numerical portion
numeral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610890027.1A
Other languages
English (en)
Inventor
李为凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Media Technology (hunan) Co Ltd
Original Assignee
Digital Media Technology (hunan) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Media Technology (hunan) Co Ltd filed Critical Digital Media Technology (hunan) Co Ltd
Priority to CN201610890027.1A priority Critical patent/CN106484662A/zh
Publication of CN106484662A publication Critical patent/CN106484662A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种混合数据排序方法和装置。混合数据排序方法包括:获取待排序数据集合中包含数字的待排序数据作为待处理数据;将所述待处理数据中的数字部分替换为指定位数的数字,生成与所述待处理数据对应的混合排序数据,其中,所述指定位数大于等于所述待处理数据中的数字部分的位数;根据所述混合排序数据,对所述待排序数据集合中的待排序数据进行排序。本发明实施例解决了单一的排序算法不能汉字和数字混合排序的问题,利用混合数据的排序方法,将汉字和数字混合内容中的数字替换成指定长度的数字内容,再按照汉字首字母顺序排序,最终可以得到汉字和数字混合排序之后的内容,达到了对汉字和数字混合数据排序的目的。

Description

一种混合数据排序方法和装置
技术领域
本发明涉及数据处理技术领域,特别涉及一种混合数据排序方法和装置。
背景技术
现有的排序算法只针对汉字按照首字母顺序排序或者只针对数字按照数值大小顺序排序,这两种排序算法在汉字和数字混合内容时无法同时做到汉字按首字母排序且数字按值大小排序。如:在安卓手机通讯录软件中,添加三个联系人(测试1,测试2,测试10),那用户看到的顺序会是“测试1,测试10,测试2”。
现有技术中的排序算法单一,不能对汉字和数字混合数据进行合理排序。
发明内容
有鉴于此,本发明实施例提供一种混合数据排序方法及装置,解决单一排序算法不能汉字和数字混合排序的问题。
第一方面,本发明实施例提供了一种混合数据排序方法,包括:
获取待排序数据集合中包含数字的待排序数据作为待处理数据;
将待处理数据中的数字部分替换为指定位数的数字,生成与待处理数据对应的混合排序数据,其中,指定位数大于等于待处理数据中的数字部分的位数;
根据混合排序数据,对待排序数据集合中的待排序数据进行排序。
第二方面,本发明实施例提供了一种混合数据排序的装置,包括:
待处理数据获取模块,用于获取待排序数据集合中包含数字的待排序数据作为待处理数据;
数字替换模块,用于将待处理数据中的数字部分替换为指定位数的数字,生成与待处理数据对应的混合排序数据,其中,指定位数大于等于待处理数据中的数字部分的位数;
排序模块,用于根据混合排序数据,对待排序数据集合中的待排序数据进行排序。
由上述技术方案可知,本发明实施例利用混合数据排序方法,将汉字和数字混合内容中的数字替换成指定长度的数字内容,再按照汉字首字母顺序排序,最终可以得到汉字和数字混合排序之后的内容。
附图说明
图1A是本发明实施例一提供的一种混合数据排序方法流程示意图;
图1B是本发明实施例一中的一种混合数据排序方法中混合排序数据生成方法流程示意图;
图1C是本发明实施例一中的一种混合数据排序方法中数字部分替换方法流程示意图;
图2A是本发明实施例二中的一种混合数据排序装置结构示意图;
图2B是本发明实施例二中的一种混合数据排序模块中混合排序数据生成单元结构示意图;
图2C是本发明实施例二中的一种混合数据排序方法中数字部分替换单元结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1A是本发明实施例一提供的一种混合数据排序方法流程示意图。该方法可以由一种混合数据排序装置来执行,该装置可以由软件和/或硬件的方式来实现。如图1A所示,该方法包括:
S110、获取待排序数据集合中包含数字的待排序数据作为待处理数据;
待排序数据集合中包含一个或多个待排序数据,待排序数据是由汉字、字母和数字等多个类型组成,进一步的,待排序数据的内容可以由单个或多个汉字、单个或多个字母、单个或多个数字、数字与字母、数字与汉字和字母与汉字组成。
例如,待排序数据集合可以是
A={测试1、cs、10、cs1、测试2、测试11、测试cs、cs12cs23};
当获取待排序数据集合A中包含数字的待排序数据作为待处理数据,则待处理数据分别是10、cs1、测试1、测试2、测试11和cs12cs23。
S120、将待处理数据中的数字部分替换为指定位数的数字,生成与待处理数据对应的混合排序数据,其中,指定位数大于等于待处理数据中的数字部分的位数;
待处理数据中的数字部分可以是初始数据的头部、尾部、中部和全部。需要说明的是,处理数据中的数字部分的个数可以是一个或多个。
在对待处理数据中的数字部分进行替换之前,应先对待处理数据中的数字部分进行识别并获取。
进一步的,如图1B所示,将待处理数据中的数字部分替换为指定位数的数字,生成与待处理数据对应的混合排序数据还包括:
S121、顺序获取待处理数据中包括的一个字符,作为当前操作字符;
在对待处理数据中的数字部分进行获取时,应顺序获取待处理数据中包括的一个字符,并作为当前字符,当前操作字符用于被识别进而获取待处理数据中的数字部分位数和待处理数据中的数字部分。
例如,当待处理数据为测试11,则其对应的前两位当前操作字符分别为c、s。
S122、如果确定当前操作字符为数字,则继续获取当前操作字符之后的字符进行确定,直至获取以当前操作字符为起点的全部连续数字;
当获取到待处理数据的一个字符,并作为当前操作字符时,会对当前操作字符进行识别,当确定当前操作字符为数字时,会对当前操作符进行获取并保存,直到获取以当前操作字符为起点的全部连续数字。
例如,当待处理数据为测试11,其产生的前两个当前操作字符为c和s,均不是数字,因此不用对其保存,当产生第三个当前操作字符数字1,则对其获取并保存,产生第四个当前操作字符同上。由此得出,获取到所述待处理数据的数字部分为11。
S123、将全部连续数字作为待处理数据中的一个数字部分,并将数字部分替换为指定位数的数字;
在获取到待处理数据中的数字部分之后,会对数字部分进行替换操作。
进一步的,如图1C所示,将待处理数据中的数字部分替换为指定位数的数字包括:
S1231、确定待处理数据中的数字部分的数字位数;
数字位数也就是根据对待处理数据在进行上述操作之后获取并保存的数字部分的位数。
例如,当待处理数据为测试11,确定的对应的数字位数为2。
S1232、根据数字位数以及指定位数,确定填充位数;
指定位数大于等于待处理数据中的数字部分的位数,可选的,指定位数为待处理数据集合中待处理数据的最大位数。
S1233、在待处理数据中的数字部分的头部添加与填充位数对应的0值,以将待处理数据中的数字部分替换为指定位数的数字;
进一步的,指定位数包括待排序数据集合中待处理数据的最大位数。
当指定位数为待处理数据的最大位数时,指定位数也成为定值,进而确定了填充位数的位数,即确定了指定位数的数字。
上述待处理数据集合A中的待测试数据最大位数为8,其指定位数为8,则待测试数据测试11对应的的指定位数的数字为00000011。
通过在待处理数据中的数字部分的头部添加与填充位数对应的0值,使得数字部分的总位数相同,进而在基础排序算法下对数字部分进行排序得到预设结果。
基础排序规则可以是安卓系统移动终端内的联系人模块排序算法。
S124、将数字部分的结束字符作为新的当前操作字符后,返回执行顺序获取待处理数据中包括的一个字符的操作,直至完成对待处理数据中全部字符的处理。
当待处理数据中包含有数字,但不是连续数字时,则待处理数据中的数字部分的个数大于一个。
例如,当待处理数据为cs12cs23,则其对应的数字部分为两个,分别为12、23。
当对待处理数据为cs12cs23的第一个数字部分处理后,对待处理数据为cs12cs23会变成cs00000012cs23,当前操作字符则会移动到第二个“c”字母的位置,并再次执行S121到S123的操作,并获取待处理数据为cs12cs23的第二个数字部分为23,对其第二个数字部分处理后,对待处理数据为cs12cs23会变成cs00000012cs00000023。
S130、根据混合排序数据,对待排序数据集合中的待排序数据进行排序。
混合排序数据即对待处理数据中全部字符的处理后得到的数据。待处理数据与混合排序数据一一对应。
对待排序数据集合中的待排序数据进行排序时应根据单个字符对比原则。进一步的,其优先级为:数字>字母>汉字,汉字的排序顺序以单个汉字对应的拼音首字母顺序排列,字母以字母顺序排列,数字则以值大小排序。
待处理数据集合A经过处理后得到的对应混合排序数据集合为{测试、cs、00000010、cs0000001、测试0000002、测试00000011、测试cs、cs00000012cs000000023},则依照上述排序规则,得到数据集合B{10、cs、cs1、cs12cs23、测试cs、测试1、测试2、测试11}。
综上所述,本实施例提供的混合数据的排序方法通过将汉字和数字混合内容中的数字替换成指定长度的数字内容,再按照汉字首字母顺序排序,最终可以得到汉字和数字混合排序之后的内容。
实施例二
图2A是本发明实施例二提供的一种混合数据排序装置结构示意图。如图2A所示,该装置包括:待处理数据获取模块210、数字替换模块220和排序模块230。
其中,待处理数据获取模块210,用于获取待排序数据集合中包含数字的待排序数据作为待处理数据;
数字替换模块220,用于将待处理数据中的数字部分替换为指定位数的数字,生成与待处理数据对应的混合排序数据,其中,指定位数大于等于待处理数据中的数字部分的位数;指定位数包括待排序数据集合中待处理数据的最大位数;
排序模块230,用于根据混合排序数据,对待排序数据集合中的待排序数据进行排序。
综上所述,本实施例提供的混合数据的排序装置通过将汉字和数字混合内容中的数字替换成指定长度的数字内容,再按照汉字首字母顺序排序,最终可以得到汉字和数字混合排序之后的内容。
进一步的,如图2B所示,数字替换模块包括:
操作字符获取单元221,用于顺序获取待处理数据中包括的一个字符,作为当前操作字符;
数字部分获取单元222,如果确定当前操作字符为数字,则继续获取当前操作字符之后的字符进行确定,直至获取以当前操作字符为起点的全部连续数字;
数字部分替换单元223,用于将全部连续数字作为待处理数据中的一个数字部分,并将数字部分替换为指定位数的数字;指定位数包括待排序数据集合中待处理数据的最大位数;
循环替换单元224,用于将数字部分的结束字符作为新的当前操作字符后,返回执行顺序获取待处理数据中包括的一个字符的操作,直至完成对待处理数据中全部字符的处理。
进一步的,如图2C所示,数字部分替换单元包括:
待处理数字位数确定子单元2231,用于确定待处理数据中的数字部分的数字位数;
填充数字位数确定子单元2232,用于根据数字位数以及指定位数,确定填充位数;
数字填充子单元2233,用于在待处理数据中的数字部分的头部添加与填充位数对应的0值,以将待处理数据中的数字部分替换为指定位数的数字。
综上所述,根据本实施例的技术方案混合数据的排序装置,将汉字和数字混合内容中的数字替换成指定长度的数字内容,再按照汉字首字母顺序排序,最终可以得到汉字和数字混合排序之后的内容。
本发明实施例所提供的混合数据排序装置可以用于执行本发明实施例所提供的混合数据排序方法,具备相应的功能和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的混合数据排序方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种混合数据排序方法,其特征在于,包括:
获取待排序数据集合中包含数字的待排序数据作为待处理数据;
将所述待处理数据中的数字部分替换为指定位数的数字,生成与所述待处理数据对应的混合排序数据,其中,所述指定位数大于等于所述待处理数据中的数字部分的位数;
根据所述混合排序数据,对所述待排序数据集合中的待排序数据进行排序。
2.根据权利要求1所述的方法,其特征在于,所述将所述待处理数据中的数字部分替换为指定位数的数字,生成与所述待处理数据对应的混合排序数据,包括:
顺序获取所述待处理数据中包括的一个字符,作为当前操作字符;
如果确定所述当前操作字符为数字,则继续获取所述当前操作字符之后的字符进行确定,直至获取以所述当前操作字符为起点的全部连续数字;
将所述全部连续数字作为所述待处理数据中的一个数字部分,并将所述数字部分替换为指定位数的数字;
将所述数字部分的结束字符作为新的当前操作字符后,返回执行顺序获取所述待处理数据中包括的一个字符的操作,直至完成对所述待处理数据中全部字符的处理。
3.根据权利要求1或2所述的方法,其特征在于,所述指定位数包括待排序数据集合中待处理数据的最大位数。
4.根据权利要求2所述的方法,其特征在于,所述将所述待处理数据中的数字部分替换为指定位数的数字,包括:
确定所述待处理数据中的数字部分的数字位数;
根据所述数字位数以及所述指定位数,确定填充位数;
在所述待处理数据中的数字部分的头部添加与所述填充位数对应的0值,以将所述待处理数据中的数字部分替换为指定位数的数字。
5.一种混合数据排序的装置,其特征在于,包括:
待处理数据获取模块,用于获取待排序数据集合中包含数字的待排序数据作为待处理数据;
数字替换模块,用于将所述待处理数据中的数字部分替换为指定位数的数字,生成与所述待处理数据对应的混合排序数据,其中,所述指定位数大于等于所述待处理数据中的数字部分的位数;
排序模块,用于根据所述混合排序数据,对所述待排序数据集合中的待排序数据进行排序。
6.根据权利要求5所述的装置,其特征在于,所述数字替换模块包括:
操作字符获取单元,用于顺序获取所述待处理数据中包括的一个字符,作为当前操作字符;
数字部分获取单元,如果确定所述当前操作字符为数字,则继续获取所述当前操作字符之后的字符进行确定,直至获取以所述当前操作字符为起点的全部连续数字;
数字部分替换单元,用于将所述全部连续数字作为所述待处理数据中的一个数字部分,并将所述数字部分替换为指定位数的数字;
循环替换单元,用于将所述数字部分的结束字符作为新的当前操作字符后,返回执行顺序获取所述待处理数据中包括的一个字符的操作,直至完成对所述待处理数据中全部字符的处理。
7.根据权利要求5或6所述的装置,其特征在于,所述指定位数包括待排序数据集合中待处理数据的最大位数。
8.根据权利要求6所述的装置,其特征在于,所述数字部分替换单元包括:
待处理数字位数确定子单元,用于确定所述待处理数据中的数字部分的数字位数;
填充数字位数确定子单元,用于根据所述数字位数以及所述指定位数,确定填充位数;
数字填充子单元,用于在所述待处理数据中的数字部分的头部添加与所述填充位数对应的0值,以将所述待处理数据中的数字部分替换为指定位数的数字。
CN201610890027.1A 2016-10-12 2016-10-12 一种混合数据排序方法和装置 Pending CN106484662A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610890027.1A CN106484662A (zh) 2016-10-12 2016-10-12 一种混合数据排序方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610890027.1A CN106484662A (zh) 2016-10-12 2016-10-12 一种混合数据排序方法和装置

Publications (1)

Publication Number Publication Date
CN106484662A true CN106484662A (zh) 2017-03-08

Family

ID=58269858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610890027.1A Pending CN106484662A (zh) 2016-10-12 2016-10-12 一种混合数据排序方法和装置

Country Status (1)

Country Link
CN (1) CN106484662A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949378A (zh) * 2019-03-26 2019-06-28 中国科学院软件研究所 图像灰度值排序方法、装置、电子设备及计算机可读介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541873A (zh) * 2010-12-16 2012-07-04 金蝶软件(中国)有限公司 一种编码的排序方法及系统
CN105740332A (zh) * 2016-01-22 2016-07-06 北京京东尚科信息技术有限公司 数据排序方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541873A (zh) * 2010-12-16 2012-07-04 金蝶软件(中国)有限公司 一种编码的排序方法及系统
CN105740332A (zh) * 2016-01-22 2016-07-06 北京京东尚科信息技术有限公司 数据排序方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949378A (zh) * 2019-03-26 2019-06-28 中国科学院软件研究所 图像灰度值排序方法、装置、电子设备及计算机可读介质
CN109949378B (zh) * 2019-03-26 2021-06-08 中国科学院软件研究所 图像灰度值排序方法、装置、电子设备及计算机可读介质

Similar Documents

Publication Publication Date Title
US10796244B2 (en) Method and apparatus for labeling training samples
DE102013221125B4 (de) System, Verfahren und Computer-Programm-Produkt zum Durchführen einer Zeichenkette-Suche
CN107861949B (zh) 文本关键词的提取方法、装置及电子设备
CN106325596B (zh) 一种书写笔迹自动纠错方法及系统
CN106776763A (zh) 目的地搜索方法及装置
CN104077369B (zh) 多维度数据的匹配装置和匹配方法
CN106843141A (zh) 数值控制装置
CN108733644A (zh) 一种文本情感分析方法、计算机可读存储介质及终端设备
CN107832311A (zh) 一种翻译方法、装置、终端及可读存储设备
CN101930725A (zh) 一种字符显示方法和装置
CN108241612A (zh) 标点符号处理方法和装置
CN109740125B (zh) 用于文件比较的更新查找方法、装置、存储介质和设备
Ianov On the equivalence and transformation of program schemes
CN106484662A (zh) 一种混合数据排序方法和装置
CN104933030B (zh) 一种维吾尔语拼写检查方法及装置
CN109918186A (zh) 一种应用程序的切换方法、装置及智能终端
Liu et al. Adaptive activation network and functional regularization for efficient and flexible deep multi-task learning
CN106502635A (zh) 数据处理方法和装置
CN106502972B (zh) 数据状态的展示方法和装置
CN110073351A (zh) 通过组合来自用户尝试的候选来预测文本
CN103778210B (zh) 一种待分析文件的文件具体类型的判断方法及装置
CN105068992B (zh) 一种搜索结果显示方法及装置
CN104536583A (zh) 用于触屏设备的虚拟键盘设计和输入方法
CN107943322A (zh) 一种用于汉字拼音输入法的键盘及一种汉字拼音输入法
CN111090996B (zh) 一种分词的方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170308

RJ01 Rejection of invention patent application after publication