`

Linux系统日志文件系统及性能分析

 
阅读更多


作者:张文江 吴庆波 来源:赛迪网技术社区


日志文件系统可以在系统发生断电或者其它系统故障时保证整体数据的完整性,Linux是目前支持日志文件系统最多的操作系统之一,本文重点研究了Linux常用的日志文件系统:EXT3、ReiserFS、XFS和JFS日志技术,并采用标准的测试工具PostMark和 Bonnie++对它们进行了测试,给出了详细的性能分析,对Linux服务器应用具有重要的参考价值。

一、概述

所谓日志文件系统是在传统文件系统的基础上,加入文件系统更改的日志记录,它的设计思想是:跟踪记录文件系统的变化,并将变化内容记录入日志。日志文件系统在磁盘分区中保存有日志记录,写操作首先是对记录文件进行操作,若整个写操作由于某种原因(如系统掉电)而中断,系统重启时,会根据日志记录来恢复中断前的写操作。在日志文件系统中,所有的文件系统的变化都被记录到日志,每隔一定时间,文件系统会将更新后的元数据及文件内容写入磁盘。在对元数据做任何改变以前,文件系统驱动程序会向日志中写入一个条目,这个条目描述了它将要做些什么,然后它修改元数据。目前Linux的日志文件系统主要有:在Ext2基础上开发的Ext3,根据面向对象思想设计的ReiserFS,由SGI IRIX系统移植过来的XFS,由IBM AIX系统移植过来的JFS,其中EXT3完全兼容EXT2,其磁盘结构和EXT2完全一样,只是加入日志技术;而后三种文件系统广泛使用了B树以提高文件系统的效率。

二、Ext3

Ext3 文件系统是直接从Ext2文件系统发展而来,目前Ext3文件系统已经非常稳定可靠,它完全兼容Ext2文件系统,用户可以平滑地过渡到一个日志功能健全的文件系统。Ext3日志文件系统的思想就是对文件系统进行的任何高级修改都分两步进行。首先,把待写块的一个副本存放在日志中;其次,当发往日志的 I/O 数据传送完成时(即数据提交到日志),块就写入文件系统。当发往文件系统的I/O 数据传送终止时(即数据提交给文件系统),日志中的块副本就被丢弃。

2.1 Ext3日志模式

Ext3既可以只对元数据做日志,也可以同时对文件数据块做日志。具体来说,Ext3提供以下三种日志模式:

日志(Journal )

文件系统所有数据和元数据的改变都记入日志。这种模式减少了丢失每个文件所作修改的机会,但是它需要很多额外的磁盘访问。例如,当一个新文件被创建时,它的所有数据块都必须复制一份作为日志记录。这是最安全和最慢的Ext3日志模式。

预定(Ordered )

只有对文件系统元数据的改变才记入日志。然而,Ext3文件系统把元数据和相关的数据块进行分组,以便把元数据写入磁盘之前写入数据块。这样,就可以减少文件内数据损坏的机会;例如,确保增大文件的任何写访问都完全受日志的保护。这是缺省的Ext3 日志模式。

写回(Writeback )

只有对文件系统元数据的改变才记入日志;这是在其他日志文件系统发现的方法,也是最快的模式。

2.2 日志块设备(JBD)

Ext3 文件系统本身不处理日志,而是利用日志块设备(Journaling Block Device)或叫JBD 的通用内核层。Ext3文件系统调用JDB例程以确保在系统万一出现故障时它的后续操作不会损坏磁盘数据结构。Ext3 与JDB 之间的交互本质上基于三个基本单元:日志记录,原子操作和事务。

日志记录本质上是文件系统将要发出的低级操作的描述。在某些日志文件系统中,日志记录只包括操作所修改的字节范围及字节在文件系统中的起始位置。然而,JDB 层使用的日志记录由低级操作所修改的整个缓冲区组成。这种方式可能浪费很多日志空间(例如,当低级操作仅仅改变位图的一个位时),但是,它还是相当快的,因为JBD 层直接对缓冲区和缓冲区首部进行操作。

修改文件系统的任一系统调用都通常划分为操纵磁盘数据结构的一系列低级操作。如果这些低级操作还没有全部完成系统就意外宕机,就会损坏磁盘数据。为了防止数据损坏,Ext3文件系统必须确保每个系统调用以原子的方式进行处理。原子操作是对磁盘数据结构的一组低级操作,这组低级操作对应一个单独的高级操作。
出于效率的原因,JBD 层对日志的处理采用分组的方法,即把属于几个原子操作处理的日志记录分组放在一个单独的事务中。此外,与一个处理相关的所有日志记录都必须包含在同一个事务中。一个事务的所有日志记录都存放在日志的连续块中。JBD层把每个事务作为整体来处理。例如,只有当包含在一个事务的日志记录中的所有数据提交给文件系统时才回收该事务所使用的块。

三、ReiserFS

ReiserFS 是一个非常优秀的文件系统,其开发者非常有魄力,整个文件系统完全是从头设计的。目前,ReiserFS可轻松管理上百G的文件系统,这在企业级应用中非常重要。ReiserFS 是根据面向对象的思想设计的,由语义层(semantic layer)和存储层(storage layer)组成。语义层主要是对对象命名空间的管理及对象接口的定义,以确定对象的功能。存储层主要是对磁盘空间的管理。语义层与存储层是通过键(key)联系的。语义层通过对对象名进行解析生成键,存储层通过键找到对象在磁盘上存储空间,键值是全局唯一的。

3.1 语义层主要接口

1) 文件接口 每个文件拥有一个接口ID,此ID标识一个方法集,此方法集包含访问ReiserFS 文件的所有接口。

2) 属性接口 ReiserFS实现了一种新接口,把文件的每一种属性当做一个文件,属性的值就是此文件的内容,以实现对文件属性的目录式访问。

3) hash接口 目录是文件名到文件的映射表,ReiserFS是通过B+树来实现这张映射表。由于文件名是变长的,而且有时文件名会很长,所以文件名不适合作为键值,故引入了Hash函数来产生键值。

4) 安全接口 安全接口处理所有的安全性检查,通常是由文件接口触发的。下面以读文件为例:文件接口的read 方法在读入文件数据之前会调用安全接口的read chech 方法来来进行安全性检查,而后者又会调用属性文件的read方法把文件属性读入以便检查。

5) 项(Item)接口 项接口主要是一些对项进行平衡处理的方法,包括:项的拆分,项的评估,项的覆写,项的追加,项的删除,插入及查找。

6) 键分配(key Assignment)接口 当把一个键分配给一个项时,键分配接口就会被触发。每一种项都有一个与其对应的键分配方法。

3.2 存储层

ReiserFS是以B+树来存储数据的,其结构如图:


图1:ReiserFS B+ 树
在B+树中的各个结点中有一个称为项(Item)的数据结构。项是一个数据容器,一个项只属于一个结点,是结点管理空间的基本单位。如图所示,一个项包括以下内容:

1) Item_body:项的数据域

2) Item_key: 项的键值

3) Item_offset:数据域的起点在结点中的偏移量

4) Item_length: 数据域的长度

5) Item_Plugin_id:项接口ID。

图2: ReiserFS 项结构
ReiserFS设计了多种不同的项以存储不同的数据,主要有以下几种:

1) static_stat_data: 静态统计数据,包括文件的所有者,访问权限,创建时间,最近修改时间,链接数等

2) cmpnd_dir_item: 包含各个目录项

3) extend_pointers: 指向一个盘区(extend)

4) node_pointers: 指向一个结点

5) bodies: 包含的是文件的小部分数据

3.3 ReiserFS日志

与ext3 一样,ReiserFS也有三种日志模式,即journal,ordered,writeback。同时,ReiserFS引入了两种日志优化方法: copy-on-capture和steal-on-capture。copy-on-capture:当一个事务要修改的块在另一个未提交的事务中时,就把这个块复制一份,这样这两个事务就可以并发进行了。steal-on-capture:当一个块被多个事务修改时,只有最晚提交的那个事务才把这个块实际写入文件系统,其他事务都不写这个块。

四、XFS

XFS 是一种高性能的64 位文件系统,由SGI 公司为了替代原有的EFS 文件系统而开发的。XFS 通过保持cache 的一致性、定位数据和分布处理磁盘请求来提供对文件系统数据的低延迟、高带宽的访问。目前SGI已经将XFS文件系统从IRIX移植到Linux。

4.1 分配组(allocation groups)

当创建 XFS 文件系统时,底层块设备被分割成八个或更多个大小相等的线性区域(region),用户可以将它们想象成"块"(chunk)或者"线性范围(range)",在 XFS 中,每个区域称为一个"分配组"。分配组是唯一的,因为每个分配组管理自己的索引节点(inode)和空闲空间,实际上是将这些分配组转化为一种文件子系统,这些子系统透明地存在于 XFS 文件系统内。有了分配组,XFS 代码将允许多个线程和进程持续以并行方式运行,即使它们中的许多线程和进程正在同一文件系统上执行大规模 IO 操作。因此,将 XFS 与某些高端硬件相结合,将获得高性能而不会使文件系统成为瓶颈。分配组在内部使用高效的 B+树来跟踪主要数据,具有优越性能和极大的可扩展性。

4.2 日志记录

XFS 也是一种日志记录文件系统,它允许意外重新引导后的快速恢复。象 ReiserFS 一样,XFS 使用逻辑日志;它不象 ext3 那样将文字文件系统块记录到日志,而是使用一种高效的磁盘格式来记录元数据的变动。就 XFS 而言,逻辑日志记录是很适合的;在高端硬件上,日志经常是整个文件系统中争用。

分享到:
评论

相关推荐

    Linux系统管理技术手册 完整版

    第1部分全面介绍了运行单机Linux系统涉及的各种管理知识和技术,如系统引导和关机、进程控制、文件系统管理、用户管理、设备管理、系统备份、软件配置以及cron和系统日志的管理使用等。第2部分从详细讲解TCP/IP协议...

    UNIX/Linux 系统管理技术手册(第四版)

    第一部分全面介绍了运行单机Linux系统涉及的各种管理知识和技术,如系统引导和关机、进程控制、文件系统管理、用户管理、设备管理、系统备份、软件配置以及cron和系统日志的管理使用等。第二部分从详细讲解TCP/IP...

    Linux系统环境 JFS文件系统的使用介绍

    JFS提供了基于日志的字节级文件系统,该文件系统是为面向事务的高性能系统而开发的。JFS 能够在几秒或几 分钟内就把文件系统恢复到一致状态。JFS能够保证数据在任何意外宕机的情况下,不会造成磁盘数据的丢失与损坏...

    Linux中XFS文件系统的使用及创建方法 (1)

    XfS文件系统主要特性包括:数据完全性,采用XFS文件系统,当意想不到的宕机发生后,首先,由于文件系统开启了日志功能,所以你磁盘上的文件不再会意外宕机而遭到破坏了。传输特性,XFS文件系统采用优化算法,日志...

    nmon+analyser Linux性能监控及分析工具

    nmon是一款小巧但强大的Linux性能监控及分析工具。压缩包中包括nmon所有45个操作系统版本和nmon_analyser_v66.xls。nmon_analyser用于根据nmon输出的日志文件生成excel图表。

    Linux系统案例精解(完整版)(part2)

    Linux系统案例精解是一本集Linux 系统管理、Oracle 数据库、HA 高可用、系统性能分析、Linux 日志管理、磁盘阵列存储管理、Linux 内核优化于一身的综合范例指南。采用了大量的企业应用案例,将企业应用中常用的管理...

    linux系统巡检脚本

    本脚本是用于rhel centOS 等linux系统巡检使用的脚本,适用于大批量的操作,对操作系统 性能资源 安装软件 网络配置信息 日志信息 硬件信息 主机配置信息的收集,生成文件到/tmp/data/目录下

    集群好书《高性能Linux服务器构建实战》 试读章节下载

    10.7 基于Web应用的性能分析及优化案例 10.7.1 基于动态内容为主的网站优化案例 10.7.2 基于动态、静态内容结合的网站优化案例 10.8 本章小结 第5篇 集群高级应用篇 第11章 构建高可用的LVS负载均衡...

    Linux高性能服务器编程

    6.2 dup函数和dup2函数 6.3 readv函数和writev函数 6.4 sendfile函数 6.5 mmap函数和munmap函数 6.6 splice函数 6.7 tee函数 6.8 fcntl函数 第7章 Linux服务器程序规范 7.1 日志 7.1.1 Linux系统日志 ...

    Linux系统管理技术手册(第二版).高清版.part1

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    Linux系统管理技术手册(第二版).高清版.part2

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    Linux系统管理技术手册(第二版).高清版.part4

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    Linux系统管理技术手册(第二版).高清版.part3

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    大势至共享文件审计系统

    大势至共享文件审计系统分为软件版本和硬件版本:其中,硬件版本基于全面优化的高性能文件服务器专用平台,比同类配置的普通服务器性能提升至少30%(详情见下文硬件参数)。 平台架构 2U工业设计,高强度钢外壳 ...

    Linux系统管理技术手册(第二版)高清版part5(最后一个)

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    linux系统管理手册第二版2(part4-6)

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    linux系统管理手册第二版3(part7-8)

    第10章 系统日志与日志文件 第11章 软件和配置管理 第12章 TCP/IP网络 第13章 路由选择 第14章 网络硬件 第15章 域名系统 第16章 网络文件系统 第17章 共享系统文件 第18章 电子邮件 第19章 网络管理和调试 第20章 ...

    Linux系统故障诊断与排除--James Kirkland

     本书适用于Linux系统管理员及高级用户,对Linux系统感兴趣的用户也可将此书作为参考书。 第1章 系统引导、启动和关闭问题 1 1.1 引导加载程序 2 1.1.1 GRUB 2 1.1.2 LILO 10 1.1.3 当GRUB或者LILO不工作...

    RED HAT LINUX 6大全

    8.3.4 FTP的日志文件—/var/log/ xferlog 149 8.4 FTP管理工具 149 8.4.1 ftpshut 149 8.4.2 ftpwho 150 8.4.3 ftpcount 150 8.5 使用FTP客户程序 150 8.5.1 autoexpect 152 8.5.2 ncftp 152 8.5.3 tftp 153 8.5.4 ...

    Easylogger轻量级日志的 linuxdemo

    EasyLogger 是一款超轻量级(ROM, RAM)、高性能的 C/C++ 日志库,非常适合对资源敏感的软件项目,例如: IoT 产品、可穿戴设备、智能家居等等。相比 log4c、zlog 这些知名的 C/C++ 日志库, EasyLogger 的功能更加...

Global site tag (gtag.js) - Google Analytics