【操作系统 · 磁盘】磁盘调度-程序员宅基地

技术标签: 操作系统  raid  

磁盘(机械硬盘)经典结构
磁盘结构

1. 磁盘调度

磁盘、内存速度差距大,而磁盘调度可以尽可能在现有条件下提高磁盘存储子系统的性能。

1.1 磁盘性能参数

I/O传送时序

寻道时间(seek time)

寻道时间(seek time):将磁头臂移到指定磁道所需时间

旋转延迟(relation delay)

旋转延迟(relation delay):磁头到达扇区开始位置所需时间。即将磁盘的待访问地址区旋转到 读/写磁头 可访问的位置所需时间

传输时间(transfer time)

传输时间(transfer time):传输数据所需时间

向/从 磁盘传送数据时间取决于 磁盘转速:

假设,T表示传输时间,b表示要传送的字节数,N表示一个磁道中的字节数,r表示转速(r/s),则:
T = b r N T=\frac{b}{rN} T=rNb

总存取时间(access Time)

总存取时间(access Time):寻道时间 + 旋转延迟 + 传输时间

若使用Ta表示总平均存取时间时间,Ts表示平均寻道时间,1/2r表示平均旋转延迟,则:
T a = T s + 1 2 r + b r N T_{a}=T_{s}+\frac{1}{2r}+\frac{b}{rN} Ta=Ts+2r1+rNb

※ 时序比较

假设,文件占据了5个相邻磁道中的所有扇区(5个磁道 × 500个扇区/磁道 = 2500个扇区),即顺序组织。

读取第一个磁道时间如下:

平均寻道(4ms)+ 旋转延迟(4ms)+ 读500个扇区(8ms)= 16ms

假设,无需读取其余磁道,每个磁道能在 4 + 8 = 12ms 内读入,则读取整个文件:

总时间 = 16 + (4 + 12) = 64ms = 0.064s


现在随机访问(非顺序访问),对每个扇区:

平均寻道(4ms)+ 旋转延迟(4ms)+ 读1个扇区(0.16ms)= 8.016ms

总时间 = 2500 × 8.016 = 20040ms = 20.04s


显然,读取顺序对I/O性能有很大影响。在文件访问需要读/写多个扇区,我们可以控制存储方法。

1.2 磁盘调度策略

要提高磁盘调度策略,需要尽可能减少寻道时间,产生了不同的磁盘调度策略。

1.2.1 根据请求者选择

随机(Random)

随机调度(random scheduling):随机访问磁道,性能最差,多用于评估其他调度策略。

特点:用于分析、模拟

先进先出(FIFO)

先进先出(FIFO):按顺序梳理队列中的项目。

特点:最公平的调度

优先级(PRI)

优先级(PRI):基于作业优先级调度磁盘,可能会导致短作业迅速通过,而长作业滞留。

特点:在磁盘队列管理之外控制

后进先出 (LIFO)

后进先出 (LIFO):优先处理最新请求。

因事务处理顺序读取文件,将设备分配给最后到来的用户,减少磁臂运动,提高吞吐量,缩短队列长度。

特点:局部性最好,资源利用率最高

1.2.2 根据被请求者调度

最短服务优先(SSTF)

最短服务优先(SSTF):选择使磁臂从当前位置开始移动最少的磁盘I/O请求。

特点:利用率高、队列小

SCAN

SCAN(扫描) 算法,可以避免饥饿情况,又称电梯算法。

SCAN(扫描) :磁臂沿单一方向移动,在途中满足所偶为满足的请求,直至它到达这个方向上的最后一个磁道,或该方向上没有其他请求未知。

LOOK策略:SCAN后,反转服务方向,反方向扫描,同样按顺序完成所有请求。

特点:服务分布比较好

C-SCAN

C-SCAN(循环扫描):把扫描限定在一个方向上,当访问到某个方向的最后一个磁道,磁臂返回反方向末端磁道,再次开始扫描,减少了新请求的最大延迟。

特点:服务变化较低

N步 SCAN

N步 SCAN:将磁盘请求队列分成长度为N的几个子队列,每次使用SCAN处理一个子队列。处理某个队列时,新请求进入其他队列。

特点:服务保证

FSCAN

FSCAN:使用两个子队列的策略。扫描开始,所有请求置于一个队列。另一个队列为空,用于接收扫描过程中的新请求。

特点:负载敏感

2. RAID

磁盘存储器设计人员意识到,如果使用一个组件对性能的影响有限,那么并行使用多个组件(增加冗余度)可能会获得额外的性能提升。

这种思想很快形成了一种方案,被称为 独立磁盘冗余阵列 (RAID, Redundant Array of Independent Disks, 早期又称 廉价磁盘冗余阵列 )。即:使用多个小容量驱动器,代替大容量驱动器,并通过从多个驱动器访问数据的方式,提高I/O、增加容量。

RAID方案包括很多级别,其中被认可的级别有0~6,共7个级别,它们之间并没有递进关系,但表明了不同的设计体系结构。它们拥有三大共性:

  • "单体" 结构 :RAID是物理磁盘驱动器组,但OS视其为单体结构
  • 条带化 :数据分布在物理驱动器阵列中
  • 数据可恢复性 :冗余磁盘容量保存奇偶校验信息
类别 级别 说明 磁盘请求 数据可用性 大I/O数据量传送能力 小I/O请求率
条带化 0 非冗余 N 低于单个磁盘 很高 读:很高
写:很高
镜像 1 被镜像 2N 高于RAID 2、3、4、5
低于RAID 6
读:高于单个磁盘
写:与单个磁盘相近
读:最快为单个磁盘2倍
写:与单个磁盘相近
并行访问 2 通过汉明码实现冗余 N + m 明显高于单个磁盘
与 RAID 3、4、5 可比
所有列出方案最高 约为单个磁盘两倍
3 交错位奇偶校验 N + 1 明显高于单个磁盘
与 RAID 2、4、5 可比
所有列出方案最高 约为单个磁盘两倍
独立访问 4 交错块奇偶校验 N + 1 明显高于单个磁盘
与 RAID 2、3、5 可比
读:与 RAID 0 相近
写:明显慢于单个磁盘
读:与 RAID 0 相近
写:明显慢于单个磁盘
5 交错块分布奇偶校验 N + 2 明显高于单个磁盘
与 RAID 2、3、4 可比
读:与 RAID 0 相近
写:慢于单个磁盘
读:与 RAID 0 相近
写:慢于单个磁盘
6 交错块双重分布奇偶校验 N + 3 所有列出方案最高 读:与 RAID 0 相近
写:慢于 RAID 5
读:与 RAID 0 相近
写:慢于 RAID 5

2.1 RAID 0

RAID 0 和 所有 RAID 级别一样,并不是简单地把数据分布在磁盘阵列中:数据呈条状分布在所有可用磁盘中。

磁盘被划分为多个条带,这个条带可以是一个物理块、扇区。这些条带被循环映射到连续的阵列成员。

在一个 n 磁盘阵列中,最初的 n 个逻辑条带保存在 n 个磁盘的每个磁盘上的第一个条带中,从而形成了第一条条带。这样,若访问多个逻辑上连续的条带,可实现并行处理,大大减少了I/O传输时间。

RAID 0(无冗余)

实现高数据传送能力

  1. 确保 主机存储器(内存)、单个磁盘驱动器之间的整个路径(内部控制总线、主机系统I/O总线、I/O适配器、主机存储器总线)的高效传输。
  2. 应用程序必须产生能够有效使用磁盘阵列的I/O请求。

实现高速I/O请求率

  1. 对于少量数据的单独I/O请求,I/O时间由 寻道时间、旋转延迟 决定。
  2. 对于事务处理环境中,每秒可能由上百条I/O请求。磁盘阵列可以在多个磁盘中平衡I/O负载来提供更高速率。

RAID 0 高速 I/O

2.2 RAID 1

RAID 1(镜像)

RAID 2 ~ 6 通过某种形式的奇偶计算实现冗余,而 RAID 1 通过临时复制所有数据实现冗余。

RAID 1 较好特征:

  1. 读请求可由包含被请求数据的任何一个磁盘提供服务
  2. 写请求对两个相应条带进行更新,但可并行完
  3. 恢复简单。当一个驱动器失效,可从另一个驱动器访问数据

RAID 1 成本较高,它需要 两倍于 逻辑磁盘空间 的物理磁盘空间。在面向事务处理的环境中,读请求 RAID 1 性能 接近 RAID 0 两倍,写请求并无太大优势。

可以按照这种方式操作,因同步需要时间,所以性能接近两倍。

RAID 1 高速 I/O

2.3 RAID 2

RAID 2 采用并行访问技术 + 条带化技术,所有磁盘成员参与某个I/O请求执行,条带通常仅有 1个字节 / 1个字。

被请求数据时,相关错误校正码被送到阵列控制器,如果有一位错误,控制器可以立即识别并改正这个错误,使得读操作的存取时间不会减慢。写操作必须同时访问数据磁盘、奇偶校验磁盘。

RAID 2(汉明码冗余)

2.4 RAID 3

RAID 3 采用并行访问技术 + 条带化技术,所有磁盘成员参与某个I/O请求执行,条带通常仅有 1个字节 / 1个字。RAID 3 相比于 RAID 2 更加廉价,无论磁盘阵列多大,仅需一个冗余磁盘。

RAID 3(交错位奇偶校验)

冗余性 - 奇偶校验

数据重建流程:考虑5个驱动器阵列,其中 X0 ~ X3 包含数据,X4位奇偶校验磁盘。

第 i 位奇偶校验计算:
X 4 ( i ) = X 3 ( i ) ⊕ X 2 ( i ) ⊕ X 1 ( i ) ⊕ X 0 ( i ) X4(i)=X3(i)⊕X2(i)⊕X1(i)⊕X0(i) X4(i)=X3(i)X2(i)X1(i)X0(i)
式中,⊕表示异或操作。

驱动器1失效,则上式两边加上X4(i)⊕X1(i),得:
X 1 ( i ) = X 4 ( i ) ⊕ X 3 ( i ) ⊕ X 2 ( i ) ⊕ X 0 ( i ) X1(i)=X4(i)⊕X3(i)⊕X2(i)⊕X0(i) X1(i)=X4(i)X3(i)X2(i)X0(i)
由此,X1中数据内容可由阵列中其余磁盘相应条带内容重新生成(原理适用于RAID 3 ~ 6),数据丢失后通过异或得到数据,这种模式称为 缩减模式(reduced mode)

性能 :RAID 3 因条带小,数据传送率高。但面对事务处理时,效果不佳。

2.5 RAID 4

RAID 4 采用独立访问技术 + 条带化技术,每个磁盘成员都单独运转,因此不同I/O能够并行执行。

独立访问阵列 适合 需要较高I/O请求速度的应用,不适合需要较高数据传送率的应用。

RAID 4(块奇偶校验)

2.6 RAID 5

RAID 5 采用独立访问技术 + 条带化技术,并将奇偶校验条带分布在所有磁盘中(循环分配),避免了 RAID 4 奇偶校验磁盘的潜在 I/O 瓶颈问题。

RAID 5(块分布奇偶校验)

2.7 RAID 6

RAID 6 使用独立访问技术 + 条带化技术,并采用两种不同的奇偶校验计算,因此需要 N+2 个磁盘组成。

RAID 6(双重冗余)

3. 磁盘高速缓存

类似于 位于内存、处理器间的 高速缓冲存储器(cache memory),磁盘高速缓存是内存中为磁盘扇区设置的一个缓冲区,它包含有磁盘部分扇区副本。

两种算法:

  • 最近最少使用算法(LRU)
  • 最不常使用页面置换算法(Least Frequently Used, LFU)

一种基于频率的置换方案方案:将栈分为三个区:新区、中间区、老区。位于新区中的快访问计数器不会增加,只有老区符合置换条件。中间区使得比较频繁访问的块有机会在进入老区前,增加自己的访问计数器,以至于不会很快被置换。

用两种不同的奇偶校验计算,因此需要 N+2 个磁盘组成。

磁盘缓冲频率置换

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Bitter_Li/article/details/122028168

智能推荐

前端开发之vue-grid-layout的使用和实例-程序员宅基地

文章浏览阅读1.1w次,点赞7次,收藏34次。vue-grid-layout的使用、实例、遇到的问题和解决方案_vue-grid-layout

Power Apps-上传附件控件_powerapps点击按钮上传附件-程序员宅基地

文章浏览阅读218次。然后连接一个数据源,就会在下面自动产生一个添加附件的组件。把这个控件复制粘贴到页面里,就可以单独使用来上传了。插入一个“编辑”窗体。_powerapps点击按钮上传附件

C++ 面向对象(Object-Oriented)的特征 & 构造函数& 析构函数_"object(cnofd[\"ofdrender\"])十条"-程序员宅基地

文章浏览阅读264次。(1) Abstraction (抽象)(2) Polymorphism (多态)(3) Inheritance (继承)(4) Encapsulation (封装)_"object(cnofd[\"ofdrender\"])十条"

修改node_modules源码,并保存,使用patch-package打补丁,git提交代码后,所有人可以用到修改后的_修改 node_modules-程序员宅基地

文章浏览阅读133次。删除node_modules,重新npm install看是否成功。在 package.json 文件中的 scripts 中加入。修改你的第三方库的bug等。然后目录会多出一个目录文件。_修改 node_modules

【】kali--password:su的 Authentication failure问题,&sudo passwd root输入密码时Sorry, try again._password: su: authentication failure-程序员宅基地

文章浏览阅读883次。【代码】【】kali--password:su的 Authentication failure问题,&sudo passwd root输入密码时Sorry, try again._password: su: authentication failure

整理5个优秀的微信小程序开源项目_微信小程序开源模板-程序员宅基地

文章浏览阅读1w次,点赞13次,收藏97次。整理5个优秀的微信小程序开源项目。收集了微信小程序开发过程中会使用到的资料、问题以及第三方组件库。_微信小程序开源模板

随便推点

Centos7最简搭建NFS服务器_centos7 搭建nfs server-程序员宅基地

文章浏览阅读128次。Centos7最简搭建NFS服务器_centos7 搭建nfs server

Springboot整合Mybatis-Plus使用总结(mybatis 坑补充)_mybaitis-plus ruledataobjectattributemapper' and '-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏3次。前言mybatis在持久层框架中还是比较火的,一般项目都是基于ssm。虽然mybatis可以直接在xml中通过SQL语句操作数据库,很是灵活。但正其操作都要通过SQL语句进行,就必须写大量的xml文件,很是麻烦。mybatis-plus就很好的解决了这个问题。..._mybaitis-plus ruledataobjectattributemapper' and 'com.picc.rule.management.d

EECE 1080C / Programming for ECESummer 2022 Laboratory 4: Global Functions Practice_eece1080c-程序员宅基地

文章浏览阅读325次。EECE 1080C / Programming for ECESummer 2022Laboratory 4: Global Functions PracticePlagiarism will not be tolerated:Topics covered:function creation and call statements (emphasis on global functions)Objective:To practice program development b_eece1080c

洛谷p4777 【模板】扩展中国剩余定理-程序员宅基地

文章浏览阅读53次。被同机房早就1年前就学过的东西我现在才学,wtcl。设要求的数为\(x\)。设当前处理到第\(k\)个同余式,设\(M = LCM ^ {k - 1} _ {i - 1}\) ,前\(k - 1\)个的通解就是\(x + i * M\)。那么其实第\(k\)个来说,其实就是求一个\(y\)使得\(x + y * M ≡ a_k(mod b_k)\)转化一下就是\(y * M ...

android 退出应用没有走ondestory方法,[Android基础论]为何Activity退出之后,系统没有调用onDestroy方法?...-程序员宅基地

文章浏览阅读1.3k次。首先,问题是如何出现的?晚上复查代码,发现一个activity没有调用自己的ondestroy方法我表示非常的费解,于是我检查了下代码。发现再finish代码之后接了如下代码finish();System.exit(0);//这就是罪魁祸首为什么这样写会出现问题System.exit(0);////看一下函数的原型public static void exit (int code)//Added ..._android 手动杀死app,activity不执行ondestroy

SylixOS快问快答_select函数 导致堆栈溢出 sylixos-程序员宅基地

文章浏览阅读894次。Q: SylixOS 版权是什么形式, 是否分为<开发版税>和<运行时版税>.A: SylixOS 是开源并免费的操作系统, 支持 BSD/GPL 协议(GPL 版本暂未确定). 没有任何的运行时版税. 您可以用她来做任何 您喜欢做的项目. 也可以修改 SylixOS 的源代码, 不需要支付任何费用. 当然笔者希望您可以将使用 SylixOS 开发的项目 (不需要开源)或对 SylixOS 源码的修改及时告知笔者.需要指出: SylixOS 本身仅是笔者用来提升自己水平而开发的_select函数 导致堆栈溢出 sylixos

推荐文章

热门文章

相关标签