专栏内容:
- 手写数据库toadb
本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。
本专栏会定期更新,对应的代码也会定期更新,每个阶段的代码会打上tag,方便阶段学习。
开源贡献:
- toadb开源库
个人主页:我的主页
管理社区:开源数据库
座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物.
随着信息技术的飞速发展,数据已经渗透到各个领域,成为现代社会最重要的资产之一。在这个大数据时代,数据库理论在数据管理、存储和处理中发挥着至关重要的作用。然而,很多读者可能对数据库理论感到困惑,不知道如何选择合适的数据库,如何设计有效的数据库结构,以及如何处理和管理大量的数据。因此,本专栏旨在为读者提供一套全面、深入的数据库理论指南,帮助他们更好地理解和应用数据库技术。
数据库理论是研究如何有效地管理、存储和检索数据的学科。在现代信息化社会中,数据量呈指数级增长,如何高效地处理和管理这些数据成为一个重要的问题。同时,随着云计算、物联网、大数据等新兴技术的不断发展,数据库理论的重要性日益凸显。
因此,本专栏的分享希望可以提高大家对数据库理论的认识和理解,对于感兴趣的朋友带来帮助。
有效性确认是另一种乐观的并发控制模型,它允许事务不经过封锁访问数据,同时在适当的时候检查事务是否以一种可串行化的方式执行。
实际数据库中会将几种并发控制混合使用,这里将它们独立开来,易于我们理解,本文将介绍有效性确认模型的运行机制,规则。
有效性确认与时间戳模型的区别在于,前者需要维护一个关于活跃事务正在做什么的记录列表,而不是为所有数据库元素保存访问的时间戳。
事务开始时,在数据库元素写入值前的那一刻,它经过一个有效性确认阶段。这个阶段中,用它已经读的和将要写的元素集合,与其它活跃事务的写集合做比较,如果存在事实上不可实现行为的风险时,该事务就被回滚。
有效性确认被用做并发控制时,对于事务T,调度器必须被告诉事务所读的和写的数据库元素的集合,它们分别记作读集合RS(T),写集合WS(T)。
那么事务分三个阶段来执行:
读阶段;在第一阶段,事务从数据库中读取读集合中的所有元素,同时事务还需要计算它将要写的数据库元素集合。
有效性确认阶段;在这一阶段,调度器通过比较该事务与其它活跃事务的读写集合来确认该事务的有效性,详细步骤在下面进行介绍。如果确认失败,则该事务回滚,否则它将进入下一阶段。
写阶段;在这一阶段中,事务往数据库中写入其写集合中的数据库元素值。
调度器假定有效性确认是一瞬间完成的,这样基于有效性确认的调度器对事务的进行有一个假定的串行顺序,并且它根据这一串行顺序来决定事务是否有效。
为了支持做出事务有效性的决定,调度器维护数据集合:
START集合;事务已经开始,但还未做有效性确认,此类事务的集合。对这个集合中的事务,调度器维护事务开始的时间。
VAL;已经确认有效性,但尚未完成第三阶段的事务集合。也就是事务T的确认时间。
FIN;已经完成第三阶段的事务,也就是事务的完成时间;对于此集合中的事务T,调度器记录START(T),VAL(T),FIN(T)三个值。
随着事务数量的增加,这个数据集合是不断增长的,假如对于任意活跃事务U,它的START(U)大于集合中的事务T的FIN(T)时,那么事务T就可以从此集合中踢除,防止集合的无限增长。
如果事务按照有效性确认的阶段顺序执行,那么使用上述集合就可以识别出任何违反顺序的事务。有效性确认的规则有如下几条:
对于所有经过了有效性确认且在事务T开始前,还没有完成的事务U,对于它满足条件 FIN(U) > START(T),此时检测是否RS(T) 与 WS(U)交集是否为空;
对于所有经过了有效性确认,且在事务T有效性确认前还没有完成的U,对于它满足条件 FIN(U) > VAL(T),对于U检测是否有WS(T) 与 WS(U) 的交集为空。
在事务T有效性确认时,因为事务T已经读过X,但是事务U写的X值并没有提交,所以事务T有效性确认不过。
在事务U写X之前,晚开始的事务T先对X进行了写入,按照有效性确认规则处理如下:
有效性确认假定是在瞬时完成,实际不会是这样,尤其在多处理器的机器上,需要通过原子同步的方法来达到有序完成的效果。
非常感谢大家的支持,在浏览的同时别忘了留下您宝贵的评论,如果觉得值得鼓励,请点赞,收藏,我会更加努力!
作者邮箱:study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出,互相学习。