14 当我们更新Buffer Pool中的数据时,flush链表有什么用?
1、脏数据页到底为什么会脏?
在执行增删改的时候,如果发现数据页没缓存,那么必然会基于free链表找到一个空闲的缓存页,然后读取到缓存页里去,但是如果已经缓存了,那么下一次就必然会直接使用缓存页。
反正不管怎么样,你要更新的数据页都会在Buffer Pool的缓存页里,供你在内存中直接执行增删改的操作。
接着你肯定会去更新Buffer Pool的缓存页中的数据,此时一旦你更新了缓存页中的数据,那么缓存页里的数据和磁盘上的数据页里的数据,是不是就不一致了?
这个时候,我们就说缓存页是脏数据,脏页。

2、哪些缓存页是脏页呢?
这些在内存里更新的脏页的数据,都是要被刷新回磁盘文件的。
但是这里就有一个问题了,不可能所有的缓存页都刷回磁盘的,因为有的缓存页可能是因为查询的时候被读取到Buffer Pool里去的,可能根本没修改过!
所以数据库在这里引入了另外一个跟free链表类似的flush链表,这个flush链表本质也是通过缓存页的描述数据块中的两个指针,让被修改过的缓存页的描述数据块,组成一个双向链表。
凡是被修改过的缓存页,都会把他的描述数据块加入到flush链表中去,flush的意思就是这些都是脏页,后续都是要flush刷新到磁盘上去的。
所以flush链表的结构如下图所示,跟free链表几乎是一样的。

3、flush链表构造的伪代码演示
用一些伪代码来给大家展示一下这个flush链表的构造过程,比如现在缓存页01被修改了数据,那么他就是脏页了,此时就必须把他加入到flush链表中去。
此时缓存页01的描述数据块假设如下所示:
//描述数据块
DescriptionDataBlock{
//这是缓存页01的数据块
block_id = block01
//在free链表中的上一个节点和下一个节点
//因为这个缓存页已经被更新过了,不在free链表里了
//所以前后指针都是null
free_pre = null
free_next = null
//在flush链表中的上一个节点和下一个节点
//因为在flush链表中就他一个节点,所以都是null
flush_pre = null
flush_next = null
}
//flush链表的基础节点
FlushLinkListBaseNode{
//基础节点指向链表起始节点和结束节点的指针
//flush链表中目前就一个缓存页01,所以指向他的描述数据块
start = block01
end = block01
//flush链表中有几个节点
count = 1
}
好了,我们可以看到,现在flush链表的基础节点就指向了一个block01的节点,接着比如缓存页02被更新了,他也是脏页了,此时他的描述数据块也要被加入到flush链表中去。
此时伪代码如下:
//描述数据块
DescriptionDataBlock{
//这是缓存页01的数据块
block_id = block01
//在free链表中的上一个节点和下一个节点
//因为这个缓存页已经被更新过了,不在free链表里了
//所以前后指针都是null
free_pre = null
free_next = null
//在flush链表中的上一个节点和下一个节点
//因为在flush链表中下一个节点是block02,所以flush_next指向block02
//下一个节点就是null
flush_pre = null
flush_next = block02
}
//描述数据块
DescriptionDataBlock{
//这是缓存页02的数据块
block_id = block02
//在free链表中的上一个节点和下一个节点
//因为这个缓存页已经被更新过了,不在free链表里了
//所以前后指针都是null
free_pre = null
free_next = null
//在flush链表中的上一个节点和下一个节点
//因为在flush链表中上一个节点是block01,所以flush_pre指向block01
flush_pre = block01
flush_next = null
}
//flush链表的基础节点
FlushLinkListBaseNode{
//基础节点指向链表起始节点和结束节点的指针
//flush链表中目前有缓存页01和02,所以指向他的描述数据块
start = block01 //起始节点是block01
end = block02 //尾节点是block02
//flush链表中有几个节点
count = 2
}
当你更新缓存页的时候,通过变换缓存页中的描述数据块的flush链表的指针,就可以把脏页的描述数据块组成一个双向链表,也就是flush链表,而且flush链表的基础节点会指向起始节点和尾巴节点。
通过这个flush链表,就可以记录下来哪些缓存页是脏页了!