CN103914565B - 一种向数据库插入数据的方法及装置 - Google Patents

一种向数据库插入数据的方法及装置 Download PDF

Info

Publication number
CN103914565B
CN103914565B CN201410160707.9A CN201410160707A CN103914565B CN 103914565 B CN103914565 B CN 103914565B CN 201410160707 A CN201410160707 A CN 201410160707A CN 103914565 B CN103914565 B CN 103914565B
Authority
CN
China
Prior art keywords
data
read
tables
write locks
buffering area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410160707.9A
Other languages
English (en)
Other versions
CN103914565A (zh
Inventor
周星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sohu New Media Information Technology Co Ltd
Original Assignee
Beijing Sohu New Media Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sohu New Media Information Technology Co Ltd filed Critical Beijing Sohu New Media Information Technology Co Ltd
Priority to CN201410160707.9A priority Critical patent/CN103914565B/zh
Publication of CN103914565A publication Critical patent/CN103914565A/zh
Application granted granted Critical
Publication of CN103914565B publication Critical patent/CN103914565B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种向数据库插入数据的方法及装置,所述方法包括:获取需要向数据库的第一数据表插入的行数据,该行数据中的每个数据项与第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应;按照下述方式完成向数据库插入数据的操作:使第一计数器累加一个计数,并将行数据放入第一缓冲区中;判断第一计数器中的计数值是否达到设定阈值;如果是,则使第一计数器中的计数值置为零,将第一缓冲区中缓冲的所有行数据放入第一数据表中,清除第一缓冲区中缓冲的所有行数据,继续执行获取行数据的步骤;如果否,则继续执行获取行数据的步骤;其中,在至少一次的第一读写锁的访问控制期间完成上述操作中的读写操作。

Description

一种向数据库插入数据的方法及装置
技术领域
本发明涉及数据库技术领域,尤其涉及一种向数据库插入数据的方法及装置。
背景技术
关系数据库是建立在关系模型基础上的数据库,其借助于集合代数等数学概念和方法来处理数据库中的数据,譬如,MySQL就是一个关系型数据库管理系统。MySQL数据库既支持单行的插入操作,也支持多行批量插入操作。例如:单行插入操作的形式为:insert into table_a values(a1, b1,c1),表示将数组(a1,b1,c1)插入到表table_a中;多行插入操作的形式为:insert into table_a values(a1,b1,c1),(a2,b2,c2),表示将数组(a1,b1,c1)和(a2,b2,c2)插入到表table_a中。一般而言,若需要插入相同数目的行,一次多行插入操作的效率要比多次单行插入的效率要高,举个例子,当往同一个表中插入10行数据时,一次批量插入操作比10次单行插入效率要高很多。
现有方案中,在多线程环境下,每个线程有自己单独的缓冲区,即缓冲区不会横跨线程。当需要向数据库的表table_a中插入多行数据时,若每行数据中的数据顺序均相同、且每行数据都没有缺失的情况下,则将所述多行数据放入对应线程的缓冲区中,待所述缓冲区中的数据行数达到设定阈值时,便将所述多行数据批量插入到数据库中的表table_a中;若因某行数据中存在缺省项导致需要插入的行数据顺序与数据库中的行数据顺序不对应,则对该行数据进行处理并采用单行插入的方式将该行数据插入到数据库中。
但是,由于每个线程单独拥有缓冲区,每个缓冲区只有达到阈值要求时才能进行批量插入,基于数据较大地分散在各个线程的缓冲区中,若缓冲区中的行数据数量长时间不能满足阈值要求,将导致缓冲区的行数据长时间处于等待的状态,从而降低了数据插入的效率,若采用单行插入的方式将导致数据插入效率较低。
发明内容
有鉴于此,本发明实施例的主要目的在于提供一种向数据库插入数据的方法及装置,以实现提高数据插入效率的目的。
为实现上述目的,本发明提供了一种向数据库插入数据的方法,所述数据库中的每个数据表与一个计数器、一个缓冲区和一个读写锁相互对应,所述方法包括:
获取需要向所述数据库的第一数据表插入的行数据,所述行数据中的每个数据项与所述第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应;
按照下述方式完成向数据库插入数据的操作:
使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;判断所述第一计数器中的计数值是否达到设定阈值;如果是,则使所述第一计数器中的计数值置为零,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中,清除所述第一缓冲区中缓冲的所有行数据,继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;其中,在至少一次的所述第一读写锁的访问控制期间完成上述操作中的读写操作,所述第一读写锁的访问控制期间是从开启所述第一读写锁后到关闭所述第一读写锁前的期间。
优选地,具体按照下述方式完成向数据库插入数据的操作:
在第一次开启所述第一读写锁的写模式后、且在第一次关闭所述第一读写锁的写模式前,使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;
判断所述第一计数器中的计数值是否达到设定阈值;
如果是,则在第二次开启所述第一读写锁的写模式后、且在第二次关闭所述第一读写锁的写模式前,使所述第一计数器中的计数值置为零;在开启所述第一读写锁的读模式后、且在关闭所述第一读写锁的读模式前,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中;在第三次开启所述第一读写锁的写模式后、且在第三次关闭所述第一读写锁的写模式前,清除所述第一缓 冲区中缓冲的所有行数据;继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;
如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤。
优选地,所述第一数据表与第一预处理表相互对应,所述第一预处理表中按预设顺序存储了所述第一数据表中的每个字段,所述第一预处理表中每个字段对应的初始数据为空值;
所述获取需要向所述数据库的第一数据表插入的行数据,具体包括:
将所述行数据中的每个数据项与所述第一预处理表中的字段进行对应,并利用所述每个数据项替换所述第一预处理表中对应字段所对应的空值;
按所述预设顺序获取与所述预处理表中每个字段对应的每个数据项。
优选地,所述第一预处理表为第一哈希表。
优选地,所述第一计数器的计数值和所述第一数据表的表名存储于第二哈希表中,所述第一缓冲区中缓冲的行数据和所述第一数据表的表名存储于第三哈希表中,所述第一读写锁的数据结构和所述第一数据表的表名存储于第四哈希表中;
所述方法还包括:
根据哈希算法获取与所述第一数据表的表名对应的第一计数器、第一缓冲区和第一读写锁。
本发明实施例还提供了一种向数据库插入数据的装置,所述数据库中的每个数据表与一个计数器、一个缓冲区和一个读写锁相互对应,所述装置包括:
行数据获取模块,用于获取需要向所述数据库的第一数据表插入的行数据,所述行数据中的每个数据项与所述第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应;
数据处理模块,用于按照下述方式完成向数据库插入数据的操作:
使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;判断所述第一计数器中的计数值是否达到设定阈值;如果是,则使所述第一计数器中的计数值置为零,将所述第一缓冲区中缓冲的所有行数据放入所述 第一数据表中,清除所述第一缓冲区中缓冲的所有行数据,继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;其中,在至少一次的所述第一读写锁的访问控制期间完成上述操作中的读写操作,所述第一读写锁的访问控制期间是从开启所述第一读写锁后到关闭所述第一读写锁前的期间。
优选地,所述数据处理模块,具体包括:
第一处理子模块,用于在第一次开启所述第一读写锁的写模式后、且在第一次关闭所述第一读写锁的写模式前,使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;
阈值判断子模块,用于判断所述第一计数器中的计数值是否达到设定阈值;
第二处理子模块,用于在所述阈值判断子模块判断得到的所述第一计数器中的计数值达到设定阈值时,在第二次开启所述第一读写锁的写模式后、且在第二次关闭所述第一读写锁的写模式前,使所述第一计数器中的计数值置为零;在开启所述第一读写锁的读模式后、且在关闭所述第一读写锁的读模式前,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中;在第三次开启所述第一读写锁的写模式后、且在第三次关闭所述第一读写锁的写模式前,清除所述第一缓冲区中缓冲的所有行数据;继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;
第三处理子模块,用于在所述阈值判断子模块判断得到的所述第一计数器中的计数值未达到设定阈值时,继续利用所述行数据获取模块执行所述获取需要向所述数据库的第一数据表插入的行数据的功能。
优选地,所述第一数据表与第一预处理表相互对应,所述第一预处理表中按预设顺序存储了所述第一数据表中的每个字段,所述第一预处理表中每个字段对应的初始数据为空值;
所述行数据获取模块,具体包括:
数据替换子模块,用于将所述行数据中的每个数据项与所述第一预处理表中的字段进行对应,并利用所述每个数据项替换所述第一预处理表中对应字段 所对应的空值;
行数据获取子模块,用于按所述预设顺序获取与所述预处理表中每个字段对应的每个数据项。
优选地,所述第一预处理表为第一哈希表。
优选地,所述第一计数器的计数值和所述第一数据表的表名存储于第二哈希表中,所述第一缓冲区中缓冲的行数据和所述第一数据表的表名存储于第三哈希表中,所述第一读写锁的数据结构和所述第一数据表的表名存储于第四哈希表中;
所述装置还包括:
对应项获取模块,用于根据哈希算法获取与所述第一数据表的表名对应的第一计数器、第一缓冲区和第一读写锁。
本发明实施例提供的向数据库插入数据的方法及装置,首先获取满足批量插入要求的行数据,然后,利用读写锁进行控制,以在每次关闭读写锁时,可允许对其它数据表进行计数器修改、数据插入缓冲区、从缓存区读取数据、清空缓冲区数据等相关操作,保证了并发操作的高效性。与现有方案相比,本发明实施例降低了数据入库的时间延迟,同时通过批量插入的方式提高了数据库操作的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例向数据库插入数据的方法的流程示意图;
图2为本发明实施例数据读写操作的流程示意图;
图3为本发明实施例向数据库插入数据的装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的向数据库插入数据的方法及装置,不限制数据库的类型,所述数据库可以是关系型数据库也可以是其它类型的数据库。其中,所述数据库中的每个数据表与一个计数器、一个缓冲区和一个读写锁相互对应,对于所述数据库中的任意一个数据表,比如第一数据表,假设所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应。
参见图1,为本发明实施例提供的向数据库插入数据的方法的流程示意图,该方法包括以下步骤:
步骤101:获取需要向所述数据库的第一数据表插入的行数据,所述行数据中的每个数据项与所述第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应。
在本发明实施例中,所述数据库中的每个数据表都对应一个预处理表,其中,所述第一数据表与第一预处理表相互对应,所述第一预处理表中按预设顺序存储了所述第一数据表中的每个字段,所述第一预处理表中每个字段对应的初始数据为空值。
举例说明,参见表1,假设表1为所述第一预处理表的表结构,它可以是一个哈希表(包括Key值和Value值,Key值为第一数据表的字段,Value值为第一数据表的字段对应的实际数据项),即所述第一预处理表为第一哈希表。假设第一数据表的字段有:(第一字段,第二字段,第三字段),此时可按照字母顺序或是数字顺序将第一数据表的每个字段作为Key值进行排序,譬如,若按照字母顺序排序,则(第一字段,第二字段,第三字段)在表1中为(comlumnA, columnB,columnC)的形式。在每次使用所述第一预处理表前均要对表中的Value值进行初始化,即将每个Key值对应的Value值置为空值“NULL”。
表1
Key Value 
columnA “NULL”
columnB “NULL”
columnC “NULL” 
当获取到一个新的需要向第一数据表插入的行数据时,首先将新的行数据逐个填充到表1中。假如所述新的行数据为(columnA=a1,columnC=c1),由于(columnA=a1,columnC=c1)中存在缺省项即columnB对应的数据项,此时,将columnA对应的空值“NULL”替换为a1,将columnC对应的空值“NULL”替换为c1,而columnB对应的空值“NULL”保持不变,参见表2。
表2
Key Value
columnA a1
columnB “NULL”
columnC c1 
最后,按照Key值的字母顺序,获取表2中的Value值(a1,NULL,c1),(a1,NULL,c1)即为需要向所述数据库的第一数据表插入的行数据。可见,当行数据存在缺省项时,通过利用“NULL”替代缺省项,可保证每个行数据都没有缺省项,从而可以按照现有技术那样向数据库批量插入行数据且不会报错,而不必采用单行插入的方式。
基于上述举例,本发明实施例可按照下述方式实现步骤101:
将所述行数据中的每个数据项与所述第一预处理表中的字段进行对应,并利用所述每个数据项替换所述第一预处理表中对应字段所对应的空值;按所述预设顺序获取与所述预处理表中每个字段对应的每个数据项。
步骤102:按照下述方式完成向数据库插入数据的操作:
使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;判断所述第一计数器中的计数值是否达到设定阈值;如果是,则使所述第一计数器中的计数值置为零,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中,清除所述第一缓冲区中缓冲的所有行数据,继续执行步骤101;如果否,则继续执行步骤101;其中,在至少一次的所述第一读写锁的访问控制期间完成上述操作中的读写操作,所述第一读写锁的访问控制期间是从开启 所述第一读写锁后到关闭所述第一读写锁前的期间。
在本发明实施例中,参见图2所示的数据读写操作的流程示意图,可按照下述方式实现步骤102:
步骤201:在第一次开启所述第一读写锁的写模式后、且在第一次关闭所述第一读写锁的写模式前,使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中。
步骤202:判断所述第一计数器中的计数值是否达到设定阈值;如果是,则执行步骤203;如果否,则执行步骤201。
步骤203:在第二次开启所述第一读写锁的写模式后、且在第二次关闭所述第一读写锁的写模式前,使所述第一计数器中的计数值置为零。
步骤204:在开启所述第一读写锁的读模式后、且在关闭所述第一读写锁的读模式前,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中。
步骤205:在第三次开启所述第一读写锁的写模式后、且在第三次关闭所述第一读写锁的写模式前,清除所述第一缓冲区中缓冲的所有行数据;继续执行步骤201。
可见,本发明实施例是为数据库中的每个数据表配置一个缓冲区(而不是像现有技术那样为每个线程配置一个缓冲区),每个缓冲区中的数据可以是来自不同线程的行数据,所以,缓冲区中的行数据可以较快的达到设定阈值,此时,便可将缓存区中的所有数据批量插入到对应的数据表中,从而提高了向数据库插入数据的效率。此外,在行数据缓冲过程中,将计数器修改、数据插入缓冲区、从缓存区读取数据、清空缓冲区数据四个操作按读写的不同分开对待,通过利用读写锁进行控制,这样在每次关闭读写锁时,可允许对其它数据表进行上述四个操作中的相关操作,即通过调度机制对不同数据表进行操作,从而保证了公平性。
假设数据库有n个数据表,数据表平均有m列,缓冲行数的阈值平均为λ。本发明实施例在数据预处理过程中,通过初始化哈希表,将表字段作为Key值按字典顺序初始化为NULL,哈希表数据填充的时间整体开销为O(m*n),这种方法高效地解决了数据顺序性以及数据缺失的问题,而现有方案并没有相应的方法来解决这个问题。本发明实施例通过哈希方式能够保证在较短的时间内获得 目标数据表对应的计数器、缓冲区、以及读写锁,单次操作的时间开销为O(1)。数据缓冲过程中,通过阈值方式对批量插入的数量进行控制,并通过读写锁保证了并发操作的高效性。与现有方案相比,该方法降低了数据入库的时间延迟,同时通过批量插入的方式提高了数据库操作的效率,且本发明的整体空间复杂度仅为O(m*n*λ)。
另外,在实现步骤102前,需要预先获取与所述第一数据表对应的第一计数器、第一缓冲区和第一读写锁。在介绍获取方式之前首先对以下各个表格进行介绍:
表3
Key Value
table_a table_a_count
table_b table_b_count
…… …… 
参见表3,为计数器计数值的数据结构,表3的数据结构为一个哈希表。该哈希表的键(Key)为string类型,存储的实际值为数据库中数据表的表名(例如:table_a,table_b);该哈希表的值(Value)类型为int类型,代表计数器的计数值(例如:table_a_count,table_b_count),即需要向数据表插入的行数据的个数。
表4
Key Value
table_a vector<string>
table_b vector<string>
…… …… 
参见表4,为缓冲数据的数据结构,表4的数据结构为一个哈希表,是一个嵌套的哈希表结构。该哈希表的键(Key)为string类型,存储的实际值为数据库数据表的表名(例如:table_a,table_b),该哈希表的值(Value)类型为vector(容器)类型,对应一个缓冲区,所述缓冲区中可以存储动态个数的行数据,比如(a1,b1,c1),(a2,b2,c2)。
表5
Key Value
table_a 读写锁_a
table_b 读写锁_b
…… …… 
参见表5,为读写锁的数据结构,表5的数据结构为一个哈希表。该哈希表的键(Key)为string类型,存储的实际值为数据库数据表的表名(例如:table_a,table_b),该哈希表的值(Value)为读写锁数据结构。
由于上述三个表的形式都是哈希表,所以为了能够在短时间内获得目标数据表对应的计数器、缓冲区和读写锁,可通过哈希算法实现。
基于上述内容,当所述第一计数器的计数值和所述第一数据表的表名存储于第二哈希表中,所述第一缓冲区中缓冲的行数据和所述第一数据表的表名存储于第三哈希表中,所述第一读写锁的数据结构和所述第一数据表的表名存储于第四哈希表中时,本发明实施例可根据哈希算法获取与所述第一数据表的表名对应的第一计数器、第一缓冲区和第一读写锁。
参见图3,为本发明实施例提供的向数据库插入数据的装置的结构示意图,所述数据库中的每个数据表与一个计数器、一个缓冲区和一个读写锁相互对应,所述装置包括:
行数据获取模块301,用于获取需要向所述数据库的第一数据表插入的行数据,所述行数据中的每个数据项与所述第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应;
数据处理模块302,用于按照下述方式完成向数据库插入数据的操作:
使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;判断所述第一计数器中的计数值是否达到设定阈值;如果是,则使所述第一计数器中的计数值置为零,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中,清除所述第一缓冲区中缓冲的所有行数据,继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;其中,在至少一 次的所述第一读写锁的访问控制期间完成上述操作中的读写操作,所述第一读写锁的访问控制期间是从开启所述第一读写锁后到关闭所述第一读写锁前的期间。
优选地,所述数据处理模块301,具体包括:
第一处理子模块,用于在第一次开启所述第一读写锁的写模式后、且在第一次关闭所述第一读写锁的写模式前,使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;
阈值判断子模块,用于判断所述第一计数器中的计数值是否达到设定阈值;
第二处理子模块,用于在所述阈值判断子模块判断得到的所述第一计数器中的计数值达到设定阈值时,在第二次开启所述第一读写锁的写模式后、且在第二次关闭所述第一读写锁的写模式前,使所述第一计数器中的计数值置为零;在开启所述第一读写锁的读模式后、且在关闭所述第一读写锁的读模式前,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中;在第三次开启所述第一读写锁的写模式后、且在第三次关闭所述第一读写锁的写模式前,清除所述第一缓冲区中缓冲的所有行数据;继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;
第三处理子模块,用于在所述阈值判断子模块判断得到的所述第一计数器中的计数值未达到设定阈值时,继续利用所述行数据获取模块303执行所述获取需要向所述数据库的第一数据表插入的行数据的功能。
基于所述第一数据表与第一预处理表相互对应,所述第一预处理表中按预设顺序存储了所述第一数据表中的每个字段,所述第一预处理表中每个字段对应的初始数据为空值;所述行数据获取模块301,具体包括:
数据替换子模块,用于将所述行数据中的每个数据项与所述第一预处理表中的字段进行对应,并利用所述每个数据项替换所述第一预处理表中对应字段所对应的空值;
行数据获取子模块,用于按所述预设顺序获取与所述预处理表中每个字段对应的每个数据项。
优选地,所述第一预处理表为第一哈希表。
优选地,所述第一计数器的计数值和所述第一数据表的表名存储于第二哈希表中,所述第一缓冲区中缓冲的行数据和所述第一数据表的表名存储于第三哈希表中,所述第一读写锁的数据结构和所述第一数据表的表名存储于第四哈希表中;所述装置还包括:
对应项获取模块,用于根据哈希算法获取与所述第一数据表的表名对应的第一计数器、第一缓冲区和第一读写锁。
本发明实施例提供的向数据库插入数据的装置,首先获取满足批量插入要求的行数据,然后,利用读写锁进行控制,以在每次关闭读写锁时,可允许对其它数据表进行计数器修改、数据插入缓冲区、从缓存区读取数据、清空缓冲区数据等相关操作,保证了并发操作的高效性。与现有方案相比,本发明实施例降低了数据入库的时间延迟,同时通过批量插入的方式提高了数据库操作的效率。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本发明各个实施例或者实施例的某些部分所述的方法。
需要说明的是,对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种向数据库插入数据的方法,其特征在于,所述数据库中的每个数据表与一个计数器、一个缓冲区和一个读写锁相互对应,所述方法包括:
获取需要向所述数据库的第一数据表插入的行数据,所述行数据中的每个数据项与所述第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应;
按照下述方式完成向数据库插入数据的操作:
使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;判断所述第一计数器中的计数值是否达到设定阈值;如果是,则使所述第一计数器中的计数值置为零,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中,清除所述第一缓冲区中缓冲的所有行数据,继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;其中,所述第一缓冲区中的数据是来自相同或不同线程的行数据;
其中,在至少一次的所述第一读写锁的访问控制期间完成上述操作中的读写操作,所述第一读写锁的访问控制期间是从开启所述第一读写锁后到关闭所述第一读写锁前的期间。
2.根据权利要求1所述的方法,其特征在于,具体按照下述方式完成向数据库插入数据的操作:
在第一次开启所述第一读写锁的写模式后、且在第一次关闭所述第一读写锁的写模式前,使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;
判断所述第一计数器中的计数值是否达到设定阈值;
如果是,则在第二次开启所述第一读写锁的写模式后、且在第二次关闭所述第一读写锁的写模式前,使所述第一计数器中的计数值置为零;在开启所述第一读写锁的读模式后、且在关闭所述第一读写锁的读模式前,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中;在第三次开启所述第一读写锁的写模式后、且在第三次关闭所述第一读写锁的写模式前,清除所述第一缓冲区中缓冲的所有行数据;继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;
如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤。
3.根据权利要求1或2所述的方法,其特征在于,所述第一数据表与第一预处理表相互对应,所述第一预处理表中按预设顺序存储了所述第一数据表中的每个字段,所述第一预处理表中每个字段对应的初始数据为空值;
所述获取需要向所述数据库的第一数据表插入的行数据,具体包括:
将所述行数据中的每个数据项与所述第一预处理表中的字段进行对应,并利用所述每个数据项替换所述第一预处理表中对应字段所对应的空值;
按所述预设顺序获取与所述预处理表中每个字段对应的每个数据项。
4.根据权利要求3所述的方法,其特征在于,所述第一预处理表为第一哈希表。
5.根据权利要求1或2所述的方法,其特征在于,所述第一计数器的计数值和所述第一数据表的表名存储于第二哈希表中,所述第一缓冲区中缓冲的行数据和所述第一数据表的表名存储于第三哈希表中,所述第一读写锁的数据结构和所述第一数据表的表名存储于第四哈希表中;
所述方法还包括:
根据哈希算法获取与所述第一数据表的表名对应的第一计数器、第一缓冲区和第一读写锁。
6.一种向数据库插入数据的装置,其特征在于,所述数据库中的每个数据表与一个计数器、一个缓冲区和一个读写锁相互对应,所述装置包括:
行数据获取模块,用于获取需要向所述数据库的第一数据表插入的行数据,所述行数据中的每个数据项与所述第一数据表中的每个字段一一对应,所述第一数据表与第一计数器、第一缓冲区和第一读写锁相互对应;
数据处理模块,用于按照下述方式完成向数据库插入数据的操作:
使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;判断所述第一计数器中的计数值是否达到设定阈值;如果是,则使所述第一计数器中的计数值置为零,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中,清除所述第一缓冲区中缓冲的所有行数据,继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;如果否,则继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;其中,所述第一缓冲区中的数据是来自相同或不同线程的行数据;
其中,在至少一次的所述第一读写锁的访问控制期间完成上述操作中的读写操作,所述第一读写锁的访问控制期间是从开启所述第一读写锁后到关闭所述第一读写锁前的期间。
7.根据权利要求6所述的装置,其特征在于,所述数据处理模块,具体包括:
第一处理子模块,用于在第一次开启所述第一读写锁的写模式后、且在第一次关闭所述第一读写锁的写模式前,使所述第一计数器累加一个计数,并将所述行数据放入所述第一缓冲区中;
阈值判断子模块,用于判断所述第一计数器中的计数值是否达到设定阈值;
第二处理子模块,用于在所述阈值判断子模块判断得到的所述第一计数器中的计数值达到设定阈值时,在第二次开启所述第一读写锁的写模式后、且在第二次关闭所述第一读写锁的写模式前,使所述第一计数器中的计数值置为零;在开启所述第一读写锁的读模式后、且在关闭所述第一读写锁的读模式前,将所述第一缓冲区中缓冲的所有行数据放入所述第一数据表中;在第三次开启所述第一读写锁的写模式后、且在第三次关闭所述第一读写锁的写模式前,清除所述第一缓冲区中缓冲的所有行数据;继续执行所述获取需要向所述数据库的第一数据表插入的行数据的步骤;
第三处理子模块,用于在所述阈值判断子模块判断得到的所述第一计数器中的计数值未达到设定阈值时,继续利用所述行数据获取模块执行所述获取需要向所述数据库的第一数据表插入的行数据的功能。
8.根据权利要求6或7所述的装置,其特征在于,所述第一数据表与第一预处理表相互对应,所述第一预处理表中按预设顺序存储了所述第一数据表中的每个字段,所述第一预处理表中每个字段对应的初始数据为空值;
所述行数据获取模块,具体包括:
数据替换子模块,用于将所述行数据中的每个数据项与所述第一预处理表中的字段进行对应,并利用所述每个数据项替换所述第一预处理表中对应字段所对应的空值;
行数据获取子模块,用于按所述预设顺序获取与所述预处理表中每个字段对应的每个数据项。
9.根据权利要求8所述的装置,其特征在于,所述第一预处理表为第一哈希表。
10.根据权利要求6或7所述的装置,其特征在于,所述第一计数器的计数值和所述第一数据表的表名存储于第二哈希表中,所述第一缓冲区中缓冲的行数据和所述第一数据表的表名存储于第三哈希表中,所述第一读写锁的数据结构和所述第一数据表的表名存储于第四哈希表中;
所述装置还包括:
对应项获取模块,用于根据哈希算法获取与所述第一数据表的表名对应的第一计数器、第一缓冲区和第一读写锁。
CN201410160707.9A 2014-04-21 2014-04-21 一种向数据库插入数据的方法及装置 Expired - Fee Related CN103914565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410160707.9A CN103914565B (zh) 2014-04-21 2014-04-21 一种向数据库插入数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410160707.9A CN103914565B (zh) 2014-04-21 2014-04-21 一种向数据库插入数据的方法及装置

Publications (2)

Publication Number Publication Date
CN103914565A CN103914565A (zh) 2014-07-09
CN103914565B true CN103914565B (zh) 2017-05-24

Family

ID=51040245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410160707.9A Expired - Fee Related CN103914565B (zh) 2014-04-21 2014-04-21 一种向数据库插入数据的方法及装置

Country Status (1)

Country Link
CN (1) CN103914565B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045839B (zh) * 2015-06-30 2018-09-04 上海瀚之友信息技术服务有限公司 一种数据批量操作方法
CN105335482B (zh) * 2015-10-14 2018-07-03 西北工业大学 面向海量分布式数据库的批量插入方法
CN107229632A (zh) * 2016-03-24 2017-10-03 阿里巴巴集团控股有限公司 一种避免线程并发访问数据库的方法和装置
CN105912479B (zh) * 2016-04-07 2023-05-05 合肥锐世数字科技有限公司 一种并发数据的缓存方法及装置
CN107315801B (zh) * 2017-06-22 2019-12-13 中国人民解放军国防科学技术大学 并行离散事件仿真系统初始化数据存储方法
US11468781B2 (en) 2017-08-11 2022-10-11 The Boeing Company Simulation of an asset including message playback using nested hash tables
CN107491314A (zh) * 2017-08-30 2017-12-19 四川长虹电器股份有限公司 基于读写锁算法对hbase实时数据无障碍写处理方法
CN107862082B (zh) * 2017-11-29 2021-06-25 努比亚技术有限公司 基于MySQL计数器表的高并发计数方法及web服务器
CN109800270B (zh) * 2019-01-22 2020-12-04 青岛聚好联科技有限公司 一种数据存储和查询的方法及物联网系统
CN111078694A (zh) * 2019-11-29 2020-04-28 航天恒星科技有限公司 一种数据存储方法和装置
CN114756287B (zh) * 2022-06-14 2022-09-02 飞腾信息技术有限公司 一种重排序缓冲区的数据处理方法、装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5567967B2 (ja) * 2010-09-30 2014-08-06 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースにおけるキャッシュ制御方法、システム及びプログラム
CN102736987A (zh) * 2011-04-15 2012-10-17 鸿富锦精密工业(深圳)有限公司 监控数据缓存方法及系统
CN103186475A (zh) * 2011-12-29 2013-07-03 深圳市快播科技有限公司 海量数据的接收存储方法及系统

Also Published As

Publication number Publication date
CN103914565A (zh) 2014-07-09

Similar Documents

Publication Publication Date Title
CN103914565B (zh) 一种向数据库插入数据的方法及装置
Wang et al. A population-based variable neighborhood search for the single machine total weighted tardiness problem
Fernández et al. A parallel multi-objective algorithm for two-dimensional bin packing with rotations and load balancing
CN106529028A (zh) 一种工艺规程的自动生成方法
CN106203485A (zh) 一种支持向量机的并行训练方法及装置
CN108269040A (zh) 自动化存取系统作业调度优化方法及装置
Kavakli et al. Strategic knowledge differences between an expert and a novice designer
Li et al. ASLM: Adaptive single layer model for learned index
Murthy et al. Fractional cell formation in group technology
CN109325530A (zh) 基于少量无标签数据的深度卷积神经网络的压缩方法
CN105868387A (zh) 一种基于并行计算的离群数据挖掘方法
CN107844436A (zh) 一种缓存中脏数据的组织管理方法、系统及存储系统
CN110472048A (zh) 一种辅助判决方法、装置及终端设备
CN106897388A (zh) 预测微博事件热度的方法及装置
Fujimoto et al. Applications of genetic algorithm and simulation to dispatching rule-based FMS scheduling
Rabbani et al. A Markov chain analysis of the effectiveness of drum-buffer-rope material flow management in job shop environment
Lasota et al. The extinction of slowly evolving dynamical systems
Wang et al. Warehouse scheduling in airport freight station with multi-objective artificial bee colony algorithm
Hou et al. Constraint satisfaction technology for stacking problem with ordered constraints
CN106682047A (zh) 一种数据导入方法以及相关装置
Wuthrich Large deductive databases with constraints.
Zhuang et al. Research on batching strategy of medical orders based on canopy-k-means two-stage clustering algorithm
Naykhanova et al. A study of decision tree application in the problem of accounting for non-insured periods of a pensioner
Allaoua et al. Sieve Algorithm-A New Method for Optimization Problems
Zhang et al. A column generation-based algorithm for two-stage, two-dimensional bin packing problem with a variant variable sized constraint

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 100086 12, 1201, 3 building, 2 South Road, Haidian District Academy of Sciences, Beijing.

Patentee after: BEIJING SOHU NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 100084 Beijing Haidian District Zhongguancun East Road 1 hospital 9 building Sohu cyber Building 8 floor 802 room.

Patentee before: BEIJING SOHU NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170524

CF01 Termination of patent right due to non-payment of annual fee