数据库系统-故障恢复_数据库运行过程中常见的故障有哪几类各类故障如何恢复-程序员宅基地

技术标签: java  mysql  数据库系统  数据库  

一、数据库故障恢复思路

1.1 故障类型 影响

1.1.1 DMBS运行方式

利用主存(内存) 和 辅存(外存) 存储体系进行数据库管理
主存中分为:程序数据 + 系统数据
在这里插入图片描述

1.1.2 故障类型

事务故障

  • 某个事务自身运行引起的故障
  • 影响该事物本身

系统故障

  • 掉电、非正常关机等引起的故障
  • 影响正在运行的事务以及数据库缓冲区

介质故障

  • 介质损坏影响的故障
  • 影响是全面的,既影响内存中的数据,又影响介质中的数据

1.2 故障恢复

1.2.1 数据库故障恢复

把DB的当前不正确的状态恢复成已知的正确的状态
需要保证事务的:

  • 原子性:事务的所有操作为一个整体
  • 持久性:已经提交的事务,落盘 是 肯定的

1.2.2 事务故障恢复

事务可以通过重做事务Redo 和 撤销事务Undo来恢复

1.2.3 系统故障恢复

运行日志SystemLog

  • Log是DBMS维护的一个文件,以流水方式记录了每一事务对DB的每一次操作&操作的顺序
  • 运行日志直接写入介质存储上,会保持正确性
  • 事务对DB操作时,先写日志(1) 成功后 在写入DB(2)
    在这里插入图片描述

系统故障可以通过运行日志来恢复
故障恢复是需要时间的
DBMS在运行日志中定期设置河更新检查点Checkpoint

  • 检查点是这样的时刻:在该时刻,DBMS强制使内存DBbuffer中的内容和介质DB中的内容保持一致,将DBbuffer更新的所有内容写会DB中
  • 检查点表示:在检查点之前,内存中的数据与介质中的数据保持一致

系统故障的恢复

  • 检查点之前的事务不需要恢复(因为已经落盘)
  • 检查点之后的事务需要恢复(结束的重做,未结束的撤销)

在这里插入图片描述

1.2.4 介质故障恢复

副本:在某一时刻,数据库的备份
用备份来替换损坏的数据库
介质故障的恢复:用副本来替换数据库
由于介质故障影响全面,在副本替换后 还需要 日志恢复

备份时刻:转储点
过频,影响性能;过疏,运行日志过大,恢复起来慢
频率和运行日志大小有关

数据库的系统故障分为三类:事务故障、系统故障和介质故障,下面分别介绍这三类故障及其例子:

事务故障
事务故障是指在多个事务并发执行时,由于事务之间相互干扰而导致的故障。例如,当两个事务同时对同一条记录进行更新时,由于数据竞争可能导致其中一个事务无法完成操作。这种情况下,数据库管理系统需要能够检测到此类故障,并回滚未完成的事务,以保证数据的一致性。

举例来说,假设有两个事务T1和T2,都要对银行账户的余额进行修改。T1从账户中取出了100元,T2向账户中存入了50元。由于这两个事务的执行时间是交错的,所以可能会发生以下两种情况:

T1先执行,将账户余额减去100元,然后T2执行,将账户余额加上50元。此时账户余额为950元。
T2先执行,将账户余额加上50元,然后T1执行,将账户余额减去100元。此时账户余额为900元。
由于这两种情况得到的结果不同,因此需要避免这种数据竞争导致的事务故障。

系统故障
系统故障是指由于硬件故障或软件问题导致的数据库系统崩溃或失效。例如,电源故障、网络故障、操作系统故障等都可能导致系统故障。这种故障需要进行紧急处理,保证系统能够尽快恢复正常运行。

举例来说,假设数据库在写入数据时出现了错误,导致存储介质损坏或无法访问,这种情况下将会导致系统故障。

介质故障
介质故障是指由于存储介质的物理损坏或软硬件环境变化导致的数据库故障。例如,磁盘损坏、电磁波干扰、温度过高等都可能导致介质故障。这种故障需要及时修复或更换存储介质,以避免数据的长期损失。

举例来说,假设数据库存储在一台服务器上,该服务器所在的机房发生火灾,导致存储介质被烧毁,这种情况下将会导致介质故障。

综上所述,事务故障、系统故障和介质故障是数据库系统常见的故障类型,需要通过适当的技术手段进行检测、修复和预防。

二、运行日志及其检查点

2.1 DB Log

2.1.1 事务的操作

事务读写元素

  • Read(X,t):将元素X读到局部变量t中
  • writex(X,t):将事物局部变量t学回元素X
  • Input(X):将元素X从磁盘读入到内存缓冲区中
  • Output(X):将元素X写回到磁盘中
    每个事务都可以提交或者撤销
  • commit
  • abort

2.1.2 缓冲区处理策略

持久性的特性:

Force:内存中的数据最晚在commit的时候写入磁盘
No Steal:只能在commit的时候提交,不允许事务提前提交
No force:数据在内存中可以一直保留,在commit之后一段时间再写入磁盘,commit之后崩溃还没写,需要redo
Steal:允许commit之前落盘,if commit is failed, 需要undo
在这里插入图片描述

2.2 日志记录

在这里插入图片描述
在这里插入图片描述

三、三种类型的运行日志

3.1 Undo日志

记录原始值
在这里插入图片描述
Undo型日志:“将事务改变的所有数据写到磁盘前不能提交该事务”
记录的原始值
故障时直接恢复原始值
Undo日志:Undo日志记录了事务进行之前数据的原始状态,以及每个事务所做的修改,用于在回滚时恢复数据原始状态。在数据库回滚操作中,首先会根据事务的ID,找到该事务对应的Undo日志,然后根据Undo日志中的信息,恢复数据到事务之前的状态。例如,如果一个事务对某个用户的姓名进行了修改,在回滚时,可以使用Undo日志中记录的原始姓名信息,将数据恢复至修改之前的状态。

3.1.1 检查点

在这里插入图片描述

3.2 Redo日志

记录修改的操作
在这里插入图片描述记录修改操作 +1 +2 之类的
Redo日志:Redo日志记录了每个事务所做的修改操作,用于在系统发生崩溃时进行恢复。在数据库恢复操作中,首先会根据Redo日志中的信息,将缺失的数据重新写入磁盘中,以保证数据的完整性。例如,在一个在线购物网站中,如果在用户提交订单后,系统崩溃了,使用Redo日志可以将该订单重新写入磁盘中,确保订单信息不会丢失。

只能有非静止检查点(增量检查点)

3.3 Undo/Redo日志结合

记录原始值和修改的值
在这里插入图片描述
Undo、Redo日志对比

  • Undo
    • output必须先做
    • if commit T可见,那么T已经落盘,不必重做。
    • 导致频繁写磁盘
  • Redo
    • output必须后做
    • if commit T 不可见,T确定没有任何数据落盘,因此无需撤销。
    • 灵活性差,数据必须在commit之后才能见到

Redo/Undo日志:Redo/Undo日志综合了Undo和Redo日志的功能,在事务进行过程中,同时记录当前状态和操作,用于在系统崩溃时和事务回滚时进行数据恢复。在Redo/Undo日志中,Undo操作和Redo操作都会被记录下来,以保证数据的完整性和一致性。例如,如果在一个医院管理系统中,一个医生修改了某个病人的病历记录,系统同时会记录下原始病历记录和修改后的病历记录,以便在医生需要撤销修改或系统崩溃时恢复数据
在这里插入图片描述

四、利用运行日志进行故障恢复

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39381833/article/details/130400269

智能推荐

kmeans_kmeans算法相关性分析-程序员宅基地

文章浏览阅读936次。1 kmeansK-means聚类算法也称k均值聚类算法,是集简单和经典于一身的基于距离的聚类算法。它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。2.算法核心思想K-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本_kmeans算法相关性分析

基于springboot的自习室管理系统计算机毕业设计_基于springboot的共享自习室管理系统参考文献-程序员宅基地

文章浏览阅读466次,点赞8次,收藏12次。以上是基于Spring Boot的自习室管理系统的主要功能,通过这些功能可以实现自习室座位的管理、课程的管理、学员信息的管理和行为管理等功能,为自习室提供一个高效、便捷、智能的解决方案。登录后,系统将根据用户的角色显示相应的功能菜单。通过以上各个功能模块的实现,基于Spring Boot的自习室管理系统将提供一套完善的解决方案,帮助自习室提高工作效率和服务质量,为学员提供更加便捷、舒适的学习环境。通过生成相应的报表,管理员可以更好地了解自习室的使用状况和学员的学习情况,从而做出相应的决策和管理调整。_基于springboot的共享自习室管理系统参考文献

Pytroch同一个优化器优化多个模型的参数并且保存优化后的参数_pytorch加载多个模型-程序员宅基地

文章浏览阅读4.5k次,点赞7次,收藏26次。在进行深度学习过程中会遇到几个模型进行串联,这几个模型需要使用同一个优化器,但每个模型的学习率或者动量等其他参数不一样这种情况。一种解决方法是新建一个模型将这几个模型进行串联,另一种解决方法便是往优化器里面传入这几个模型的参数。..._pytorch加载多个模型

计算机软考中级合格标准,中级软考多少分及格-程序员宅基地

文章浏览阅读1.4k次。原标题:中级软考多少分及格盛泰鼎盛 对于第一次报名软考的朋友,可能对于考试合格分数线不太了解,软考分为初、中、高三个级别,那么软考中级多少分及格呢?软考中级合格标准根据往年的软考合格分数线来看,各级别的合格标准基本上统一的。2019年上半年计算机技术与软件专业技术资格(水平)考试各级别各专业各科目合格标准均为45分(总分75分)。而2016下半年计算机技术与软件专业技术资格(水平)考试除了信息系统..._计算机程序设计员中级考试内容及合格标准

爬虫相关-程序员宅基地

文章浏览阅读50次。2019独角兽企业重金招聘Python工程师标准>>> ..._爬虫考虑安全法律因素

ASP.NET Identity 的“多重”身份验证-程序员宅基地

文章浏览阅读263次。本章主要内容有:  ● 实现基于微软账户的第三方身份验证  ● 实现双因子身份验证  ● 验证码机制实现基于微软账户的第三方身份验证  在微软提供的ASP.NET MVC模板代码中,默认添加了微软、Google、twitter以及Facebook的账户登录代码(虽然被注释了),另外针对国内的一些社交账户提供了相应的组件,所有组件都可以通过Nuget包管理器安装:    从..._identity 二次登录

随便推点

C++ 敏感词屏蔽-程序员宅基地

文章浏览阅读350次。首先要解决的问题是敏感词的存储形式,这就涉及数据结构,先想想搜索屏蔽要怎么处理,比如我有一个content,我就遍历它每个字符,先看与词典中所有词第一个字符相同的,再看第二个,再看第三个.等等。那么,很明显,这就需要一种以层来存储的数据结构--树来存储敏感词汇。我首先设计了一个Node,它要存储同一级的node指针,下一级的node指针,标识词的结束,数据。最开始本来只想到用树的结构,最后发现, ...

一种隐私保护的BP神经网络的设计-程序员宅基地

文章浏览阅读167次,点赞3次,收藏7次。1. 背景介绍1.1 隐私保护的重要性在当今的数字时代,个人隐私保护已经成为一个越来越受关注的问题。随着大数据和人工智能技术的快速发展,海量的个人数据被收集和利用,这给个人隐私带来了巨大的风险。如何在利用数据的同时保护个人隐私,已经成为了一个亟待解决的挑战。

Java常用异常包_object常用方法,java常见包;常见异常-程序员宅基地

文章浏览阅读177次。1.clone方法保护方法,实现对象的浅复制,只有实现了Cloneable接口才可以调用该方法,否则抛出CloneNotSupportedException异常。2.getClass方法final方法,获得运行时类型。3.toString方法该方法用得比较多,一般子类都有覆盖。4.finalize方法该方法用于释放资源。因为无法确定该方法什么时候被调用,很少使用。5.equals方法该方法是非常重..._一般情况下,异常类存放在什么包中

队列的定义_队列又可以简称为-程序员宅基地

文章浏览阅读1.1k次。队列的定义队列简称为“对”,英文名为“Queue”。队列和堆栈一样都是特殊的线性表。和堆栈不一样的是,队列这种线性表的特殊是它限定只能在表的一端作插入运算,然后只能在表的另一端作删除运算,作插入元素的这一端为“队首”,作删除运算的这一端称为“队尾”。队列的这一特征我们又可以称它为“先进先出”。队列的这个“先进先出”就如同我们平时排队一样,讲究一个先来后到,先来的排在前面,后到的排在后面,排前面的先走,排后面的后走。队列有两种存储结构,一种是顺序排列,另一种是链式排列。如下面图的采用顺序存储结构_队列又可以简称为

数据驱动的产品研发:如何利用数据驱动提高产品安全性-程序员宅基地

文章浏览阅读867次,点赞11次,收藏20次。1.背景介绍在当今的数字时代,数据已经成为企业和组织中最宝贵的资产之一。随着数据的增长和复杂性,数据驱动的决策变得越来越重要。数据驱动的产品研发是一种新兴的方法,它利用数据来优化产品的设计、开发和运营。这种方法可以帮助企业更有效地利用数据,提高产品的安全性和质量。在这篇文章中,我们将探讨数据驱动的产品研发的核心概念、算法原理、实例和未来发展趋势。我们将涉及到以下几个方面:背景介绍核...

基础类的DSP/BIOS API调用_clk_gethtime 返回值-程序员宅基地

文章浏览阅读1.3k次。转载自:http://blog.sina.com.cn/s/blog_48b82df90100bpfj.html基础类的DSP/BIOS API调用一、时钟管理CLK(1)Uns ncounts = CLK_countspms(void) 返回每毫秒的定时器高分辨率时钟的计数值(2)LgUns currtime = CLK_gethtime(void) _clk_gethtime 返回值

推荐文章

热门文章

相关标签