CN112559521A - 话单查找方法及系统 - Google Patents

话单查找方法及系统 Download PDF

Info

Publication number
CN112559521A
CN112559521A CN202011451189.8A CN202011451189A CN112559521A CN 112559521 A CN112559521 A CN 112559521A CN 202011451189 A CN202011451189 A CN 202011451189A CN 112559521 A CN112559521 A CN 112559521A
Authority
CN
China
Prior art keywords
ticket
index
file
searched
sequence number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011451189.8A
Other languages
English (en)
Inventor
王渊明
何小栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Mass Database Technology Co Ltd
Original Assignee
Guangzhou Mass Database Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Mass Database Technology Co Ltd filed Critical Guangzhou Mass Database Technology Co Ltd
Priority to CN202011451189.8A priority Critical patent/CN112559521A/zh
Publication of CN112559521A publication Critical patent/CN112559521A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种话单查找方法及系统,该方法包括:接收话单的目录配置信息,并根据话单的目录配置信息遍历对应目录下的所有文件,进而建立话单的文件序号与话单文件路径之间的第一对应关系;接收话单的索引字段信息,根据话单的索引字段信息以及第一对应关系,建立话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及形成索引文件;接收包括待查询的索引字段的查找信息,根据待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据第一对应关系确定与待查询的文件序号对应的文件序号,根据对应的文件序号获取待查询的话单。本发明能提升话单查找效率及准确性。

Description

话单查找方法及系统
技术领域
本发明涉及话单处理技术领域,尤其涉及一种话单查找方法及系统。
背景技术
随着互联网及移动通讯的发展,话单呈现出来爆炸式的增长,随之出现了一些问题。比如在计费系统中接收来自交换机的原始话单,此话单大多采用ASN.1(AbstractSyntax Notation One)抽象语法标记或者固定二进制,固定文本格式形成话单文件,传送给计费系统。
1.阅读困难,原始话单大多为ASN.1格式或者二进制,非常不利于人查看。
2.查找困难,由于数据量大,比如需要在一个月内的话单种查找某个关键子相关的话单,非常难以定位到准确的位置。
3.存储量大,由于话单比较多,如果通过解析各字段插入到数据库,但是无形中又增加了存储空间,又难以保证数据的一致性。
发明内容
有鉴于此,本发明提供一种话单查找方法及系统,以提高话单查找效率及准确性。
一方面,本发明提供一种话单查找方法,包括:接收话单的目录配置信息,并根据所述话单的目录配置信息遍历对应目录下的所有文件,进而建立所述话单的文件序号与话单文件路径之间的第一对应关系;
接收所述话单的索引字段信息,根据所述话单的索引字段信息以及第一对应关系,建立所述话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及通过记录所述第二对应关系形成索引文件;
接收包括待查询的索引字段的查找信息,根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据所述第一对应关系确定与所述待查询的文件序号对应的文件序号,进而根据所述对应的文件序号获取待查询的话单。
进一步地,通过记录所述第二对应关系形成索引文件的步骤包括:
通过建立B+树索引或哈希索引记录所述第二对应关系形成索引文件。
进一步地,根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号的步骤包括:
根据所述待查询索引字段查找对应的查找B+树索引或者哈希索引,找到对应的索引文件,根据查找得到的索引文件得到待查询的文件序号。
进一步地,根据所述对应的文件序号获取待查询的话单的步骤包括:
根据待查询的文件序号、所述查找得到的索引文件中的话单偏移量以及索引字段偏移量,获取待查询的话单。
进一步地,根据所述对应的文件序号获取待查询的话单的步骤之后还包括:
解析所述待查询的话单,并输出对应的解析结果。
另一方面,本发明还提供一种话单查找系统,包括:
信息接收单元,用于接收话单的目录配置信息、所述话单的索引字段信息以及包括待查询的索引字段的查找信息;
关系处理单元,用于根据所述话单的目录配置信息遍历对应目录下的所有文件,进而建立所述话单的文件序号与话单文件路径之间的第一对应关系;还用于根据所述话单的索引字段信息以及第一对应关系,建立所述话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及通过记录所述第二对应关系形成索引文件;
话单查找单元,用于根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据所述第一对应关系确定与所述待查询的文件序号对应的文件序号,进而根据所述对应的文件序号获取待查询的话单。
进一步地,所述关系处理单元具体用于通过建立B+树索引或哈希索引记录所述第二对应关系形成索引文件。
进一步地,所述话单查找单元具体用于根据所述待查询索引字段查找对应的查找B+树索引或者哈希索引,找到对应的索引文件,根据查找得到的索引文件得到待查询的文件序号。
进一步地,所述话单查找单元具体用于根据待查询的文件序号、所述查找得到的索引文件中的话单偏移量以及索引字段偏移量,获取待查询的话单。
进一步地,所述的话单查找系统还包括:话单解析单元,用于解析所述待查询的话单,并输出对应的解析结果。
本发明话单查找方法及系统,根据输入的话单的目录配置信息以及索引字段信息建立第一及第二对应关系,以便于加快数据的查找,提升话单查找的效率;在原始话单的目录结构之上建立的索引(即第二对应关系),不需要另外拷贝数据,所以减少了数据的存储,保证了数据的一致性及完整性,提升话单查找准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为根据本发明示例性第一实施例的话单查找方法的流程图。
图2为根据本发明示例性第二实施例的话单查找方法的流程图。
图3为根据本发明示例性第三实施例的话单查找系统的结构框图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
图1为根据本发明示例性第一实施例的话单查找方法的流程图,如图1所示,本发明一种话单查找方法,包括:
步骤101:接收话单的目录配置信息,并根据所述话单的目录配置信息遍历对应目录下的所有文件,进而建立所述话单的文件序号与话单文件路径之间的第一对应关系;
步骤102:接收所述话单的索引字段信息,根据所述话单的索引字段信息以及第一对应关系,建立所述话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及通过记录所述第二对应关系形成索引文件;
步骤103:接收包括待查询的索引字段的查找信息,根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据所述第一对应关系确定与所述待查询的文件序号对应的文件序号,进而根据所述对应的文件序号获取待查询的话单。
本实施例根据输入的话单的目录配置信息以及索引字段信息建立第一及第二对应关系,以便于加快数据的查找,提升话单查找的效率;在原始话单的目录结构之上建立的索引(即第二对应关系),不需要另外拷贝数据,所以减少了数据的存储,保证了数据的一致性及完整性,提升话单查找准确性。
图2为根据本发明示例性第二实施例的话单查找方法的流程图。图2为图1所示方法的优选实施方式。如图2所示,话单查找方法包括:
1、用户输入各种信息。
2、判断用户输入信息的类型。
3、在用户输入信息包括原始话单的目录配置信息以插入数据时,根据配置信息遍历对应目录下的所有文件,建立原始话单的文件序号和话单文件路径的K-V关系(也可以称为第一对应关系),记录为(filenumber,file),并写入磁盘。
4、在用户输入信息包括索引字段信息以建立索引时,解析话单(支持扩展功能的解析),根据索引字段信息建立如下K-V关系(也可以称为第二对应关系),记录为(index,(filenumber,(billoffset,indexoffset)))或者如图2所示的(imsi,(filenumber,(billoffset,indexoffset))),其中,
index或者imsi表征:索引字段,
filenumber表征:文件序号,
billoffset表征:话单偏移量,
indexoffset表征:索引字段偏移量
进而通过index(imsi)为节点建立B+树索引或哈希索引记录上述K-V关系,并形成索引文件。
5、当用户输入条件为索引字段的查找信息时,根据索引字段查找B+树索引或者哈希索引,找到索引字段便找到了(index,(filenumber,(billoffset,indexoffset)))的K-V关系,然后再在第一对应关系(filenumber,file)中查找对应的文件路径,再根据文件file做对应的(billoffset,indexoffset)偏移量,便找到了对应的话单和索引字段信息,此时索引字段也可以作为校验字段。
6、最后解析话单(支持扩展功能的解析)输出检索到的话单信息给用户(图2中未示出)。
本实施例数据即为原始话单数据,还可以是压缩数据,不必再另外拷贝数据,节省空间,同时因为没有另外拷贝数据,只是在原始话单数据上读取而不进行修改,所以每次查看的数据都是最原始数据,能够确保数据的一致性,数据准确性高,此外,因为没有拷贝数据,只需要建立对应的目录便能快速建立索引,进行查找,数据初始化快提升查找效率;利用B+树索引,哈希索引等快速查找输出,查找速度快;根据数据的格式和用户输入的字段信息建立相应索引即(K-V)关系,以便于加快数据的查找,也可支持全部话单扫描在没有建立索引的情况。
图3为根据本发明示例性第三实施例的话单查找系统的结构框图。图1及图2所示实施例可以适用于本实施例,具体如图3所示,话单查找系统包括:
信息接收单元301,用于接收话单的目录配置信息、所述话单的索引字段信息以及包括待查询的索引字段的查找信息;
关系处理单元302,用于根据所述话单的目录配置信息遍历对应目录下的所有文件,进而建立所述话单的文件序号与话单文件路径之间的第一对应关系;还用于根据所述话单的索引字段信息以及第一对应关系,建立所述话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及通过记录所述第二对应关系形成索引文件;
话单查找单元303,用于根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据所述第一对应关系确定与所述待查询的文件序号对应的文件序号,进而根据所述对应的文件序号获取待查询的话单。
优选地,所述关系处理单元302具体用于通过建立B+树索引或哈希索引记录所述第二对应关系形成索引文件。
优选地,所述话单查找单元303具体用于根据所述待查询索引字段查找对应的查找B+树索引或者哈希索引,找到对应的索引文件,根据查找得到的索引文件得到待查询的文件序号。
优选地,所述话单查找单元303具体用于根据待查询的文件序号、所述查找得到的索引文件中的话单偏移量以及索引字段偏移量,获取待查询的话单。
优选地,所述的话单查找系统还包括:
话单解析单元304,用于解析所述待查询的话单,并输出对应的解析结果。
本实施例根据数据的格式和用户输入的字段信息建立相应索引即(K-V)关系,以便于加快数据的查找,优选通过建立B+树索引,利用B+树索引的特点减少磁盘I/O的次数进而加快查询速度,或者利用哈希索引的特点对数据求出哈希值后进行映射而加快速度,提升话单查找的效率;在原始话单的目录结构之上建立的索引,不需要另外拷贝数据,所以减少了数据的存储,保证了数据的一致性及完整性,提升话单查找准确性。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种话单查找方法,其特征在于,包括:
接收话单的目录配置信息,并根据所述话单的目录配置信息遍历对应目录下的所有文件,进而建立所述话单的文件序号与话单文件路径之间的第一对应关系;
接收所述话单的索引字段信息,根据所述话单的索引字段信息以及第一对应关系,建立所述话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及通过记录所述第二对应关系形成索引文件;
接收包括待查询的索引字段的查找信息,根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据所述第一对应关系确定与所述待查询的文件序号对应的文件序号,进而根据所述对应的文件序号获取待查询的话单。
2.根据权利要求1所述的话单查找方法,其特征在于,通过记录所述第二对应关系形成索引文件的步骤包括:
通过建立B+树索引或哈希索引记录所述第二对应关系形成索引文件。
3.根据权利要求2所述的话单查找方法,其特征在于,根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号的步骤包括:
根据所述待查询索引字段查找对应的查找B+树索引或者哈希索引,找到对应的索引文件,根据查找得到的索引文件得到待查询的文件序号。
4.根据权利要求3所述的话单查找方法,其特征在于,根据所述对应的文件序号获取待查询的话单的步骤包括:
根据待查询的文件序号、所述查找得到的索引文件中的话单偏移量以及索引字段偏移量,获取待查询的话单。
5.根据权利要求1-4中任一项所述的话单查找方法,其特征在于,根据所述对应的文件序号获取待查询的话单的步骤之后还包括:
解析所述待查询的话单,并输出对应的解析结果。
6.一种话单查找系统,其特征在于,包括:
信息接收单元,用于接收话单的目录配置信息、所述话单的索引字段信息以及包括待查询的索引字段的查找信息;
关系处理单元,用于根据所述话单的目录配置信息遍历对应目录下的所有文件,进而建立所述话单的文件序号与话单文件路径之间的第一对应关系;还用于根据所述话单的索引字段信息以及第一对应关系,建立所述话单对应的索引字段、文件序号、话单偏移量以及索引字段偏移量之间的第二对应关系,以及通过记录所述第二对应关系形成索引文件;
话单查找单元,用于根据所述待查询索引字段查找对应的索引文件,根据查找得到的索引文件得到待查询的文件序号,再根据所述第一对应关系确定与所述待查询的文件序号对应的文件序号,进而根据所述对应的文件序号获取待查询的话单。
7.根据权利要求6所述的话单查找系统,其特征在于,所述关系处理单元具体用于通过建立B+树索引或哈希索引记录所述第二对应关系形成索引文件。
8.根据权利要求7所述的话单查找系统,其特征在于,所述话单查找单元具体用于根据所述待查询索引字段查找对应的查找B+树索引或者哈希索引,找到对应的索引文件,根据查找得到的索引文件得到待查询的文件序号。
9.根据权利要求8所述的话单查找系统,其特征在于,所述话单查找单元具体用于根据待查询的文件序号、所述查找得到的索引文件中的话单偏移量以及索引字段偏移量,获取待查询的话单。
10.根据权利要求6-9中任一项所述的话单查找系统,其特征在于,还包括:
话单解析单元,用于解析所述待查询的话单,并输出对应的解析结果。
CN202011451189.8A 2020-12-11 2020-12-11 话单查找方法及系统 Pending CN112559521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011451189.8A CN112559521A (zh) 2020-12-11 2020-12-11 话单查找方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011451189.8A CN112559521A (zh) 2020-12-11 2020-12-11 话单查找方法及系统

Publications (1)

Publication Number Publication Date
CN112559521A true CN112559521A (zh) 2021-03-26

Family

ID=75061664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011451189.8A Pending CN112559521A (zh) 2020-12-11 2020-12-11 话单查找方法及系统

Country Status (1)

Country Link
CN (1) CN112559521A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1536509A (zh) * 2003-04-11 2004-10-13 �Ҵ���˾ 倒排索引存储方法、倒排索引机制以及在线更新的方法
CN1979469A (zh) * 2005-11-29 2007-06-13 国际商业机器公司 索引及其扩展和查询方法
CN101072205A (zh) * 2007-06-21 2007-11-14 腾讯科技(深圳)有限公司 一种聊天信息的检索方法及检索系统
CN101082918A (zh) * 2006-06-02 2007-12-05 凌阳科技股份有限公司 一种利用字母索引表查询电子词典单词的方法及其系统
JP2013210698A (ja) * 2012-03-30 2013-10-10 Hitachi Solutions Ltd ファイル検索システム及びプログラム
CN105550371A (zh) * 2016-01-27 2016-05-04 华中科技大学 一种面向大数据环境的元数据组织方法和系统
CN110110184A (zh) * 2017-12-21 2019-08-09 北京京东尚科信息技术有限公司 信息查询方法、系统、计算机系统及存储介质
CN110704375A (zh) * 2019-09-26 2020-01-17 深圳前海大数金融服务有限公司 文件管理方法、装置、设备及计算机存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1536509A (zh) * 2003-04-11 2004-10-13 �Ҵ���˾ 倒排索引存储方法、倒排索引机制以及在线更新的方法
CN1979469A (zh) * 2005-11-29 2007-06-13 国际商业机器公司 索引及其扩展和查询方法
CN101082918A (zh) * 2006-06-02 2007-12-05 凌阳科技股份有限公司 一种利用字母索引表查询电子词典单词的方法及其系统
CN101072205A (zh) * 2007-06-21 2007-11-14 腾讯科技(深圳)有限公司 一种聊天信息的检索方法及检索系统
JP2013210698A (ja) * 2012-03-30 2013-10-10 Hitachi Solutions Ltd ファイル検索システム及びプログラム
CN105550371A (zh) * 2016-01-27 2016-05-04 华中科技大学 一种面向大数据环境的元数据组织方法和系统
CN110110184A (zh) * 2017-12-21 2019-08-09 北京京东尚科信息技术有限公司 信息查询方法、系统、计算机系统及存储介质
CN110704375A (zh) * 2019-09-26 2020-01-17 深圳前海大数金融服务有限公司 文件管理方法、装置、设备及计算机存储介质

Similar Documents

Publication Publication Date Title
US7680789B2 (en) Indexing and searching numeric ranges
CN106407303A (zh) 数据存储、查询方法及装置
CN110866091B (zh) 一种数据检索方法及装置
CN109885577B (zh) 数据处理方法、装置、终端及存储介质
US7376650B1 (en) Method and system for redirecting a request using redirection patterns
CN110674247A (zh) 弹幕信息的拦截方法、装置、存储介质及设备
CN109189759B (zh) Kv存储系统中的数据读取方法、数据查询方法、装置及设备
CN111324660A (zh) 数据同步方法、装置、电子设备及机器可读存储介质
US20100205175A1 (en) Cap-sensitive text search for documents
CN112559521A (zh) 话单查找方法及系统
CN109271097A (zh) 数据处理方法、数据处理装置和服务器
CN109710860B (zh) 一种url分类匹配的方法及装置
CN112948389B (zh) 基于md5的数据库表数据比对方法及设备
CN111045994A (zh) 一种基于kv数据库的文件分类检索方法及系统
US20230138113A1 (en) System for retrieval of large datasets in cloud environments
CN111382120B (zh) 一种小文件管理方法、系统和计算机设备
CN109491699B (zh) 应用程序的资源检查方法、装置、设备及存储介质
CN111934849B (zh) 基于磁力链接的下载方法、设备、系统及可读存储介质
CN110580243A (zh) 一种文件比对方法、装置、电子设备及存储介质
CN111858609A (zh) 区块链模糊查询方法及装置
CN110489125B (zh) 文件管理方法和计算机存储介质
CN111914093A (zh) 数据处理方法和装置,存储介质和电子设备
CN105320674B (zh) 一种领域本体库的建立方法、装置及服务器
CN116955286B (zh) 一种文件搜索与分类管理方法、系统及装置
CN115630065B (zh) 一种基于多压缩模式子分区表的存储和查询方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination