linux 文件操作性能:Linux虚拟文件系统的知识
linux 文件操作性能:Linux虚拟文件系统的知识VFS文件系统采用了文件数据延迟写的技术。在调用系统接口写数据时没有使用同步写模式,而是先保存在缓存中,等满足条件时,才将数据刷入磁盘中。VFS中引入了高速磁盘缓存机制,允许内核将原本存在的磁盘上的某些信息保存在RAM中,以便这些数据的进一步访问快速进行,而不必慢速访问磁盘本身。通过虚拟文件系统,只需提供一套统一的接口给用户即可,如read/write/close/open等。用户无须了解底层使用的是什么文件系统,由内核通过虚拟文件系统进行统一操作。嵌入式进阶教程分门别类整理好了,看的时候十分方便,由于内容较多,这里就截取一部分图吧。需要的朋友私信【内核】即可领取
要想优化系统性能,那么必须了解系统的原理,然后在其原理的基础上,对系统或应用程序进行性能优化。今天讲的内容是:linux虚拟文件系统的知识。
0 背景linux系统中,使用了VFS(virtual file system)虚拟文件系统。
VFS的主要基本功能:
- 兼容linux中的不同文件系统
- 高速磁盘缓存(三类:目录项/索引节点/数据页)
- 文件数据延迟写技术
在linux中有不同的文件系统,如ext2 ext3 xfs ntfs jfs等,为了兼容不同的文件系统,并为应用层提供一个通用接口,采用了虚拟文件系统的方法。
通过虚拟文件系统,只需提供一套统一的接口给用户即可,如read/write/close/open等。用户无须了解底层使用的是什么文件系统,由内核通过虚拟文件系统进行统一操作。
嵌入式进阶教程分门别类整理好了,看的时候十分方便,由于内容较多,这里就截取一部分图吧。
需要的朋友私信【内核】即可领取
二,高速磁盘缓存VFS中引入了高速磁盘缓存机制,允许内核将原本存在的磁盘上的某些信息保存在RAM中,以便这些数据的进一步访问快速进行,而不必慢速访问磁盘本身。
2.1缓存分为三类- 目录项高速缓存: 存放描述文件系统路径名的目录项对象。(buffers)
- 索引节点高速缓存:存放描述磁盘索引节点的索引节点对象。(buffers)
- 页高速缓存: 存放完整的数据页对象,每个页所包含的数据一定属于某个文件,同时所有的文件读写操作都依赖于页高速缓存。是linux内核所使用的主要磁盘高速缓存。(cached)
VFS文件系统采用了文件数据延迟写的技术。在调用系统接口写数据时没有使用同步写模式,而是先保存在缓存中,等满足条件时,才将数据刷入磁盘中。
脏页:进程修改了缓存中的数据,相应的页标记为脏页pg_dirty。即未被同步回磁盘的页。
3.1 数据刷入磁盘条件- 文件大小超出缓存大小:页高速缓存已满,还需要更多的页,或脏页的数量已经太多。
- 时间片到达:从页变成脏页以来已过去太长时间
- 主动刷新: 进程请求对块设备或者特定文件任何待定的变化都进行刷新。通过调用sync()、fsync()或者fdatasync()系统调用来实现。
free命令:显示当前已使用和未使用的内存,包括:物理内存,swap内存,buffers,cached。
4.1 Mem物理内存第一行用全局角度描述系统使用的内存状况:
- total:总物理内存
- used:已使用物理内存,包括:buffers cached 应用程序使用内存
- free:完全未被使用的物理内存
- shared:应用程序共享内存
- buffers:缓存,主要用于目录方面 inode值等(ls大目录可看到这个值增加)
- cached:缓存,用于已打开的文件 (打开大文件可以看到变化)
公式一:total = used free
eg: 16471080 = 13939496 2531584
公式二:used = buffers cached 进程使用内存
eg: 13939496 = 1404 5474748 8463344
4.2 应用程序的内存使用第二行描述应用程序的内存使用:
前个值表示-buffers/cache——应用程序使用的内存大小,used减去缓存值
后个值表示 buffers/cache——所有可供应用程序使用的内存大小,free加上缓存值
应用程序已使用内存
-buffers/cache=used-buffers-cached
eg: 8463344 = 13939496 - 1404 - 5474748
应用程序可使用内存
buffers/cache=free buffers cached
eg: 8007739 = 2531584 1404 5474748
4.3 交换内存swap4.3.1 什么时候交换内存
当发生分页回收时,在非活跃列表中属于进程地址空间的候选分页可以被移出。目的是保证主内存的分配。linux中使用交换技术能够更有效地使用空间。
虚拟内存由物理内存和磁盘子系统或swap分区组成。如果在linux中虚拟内存管理器发现内存分页已经被分配,但是大量时间还没有使用完,它会将这个内存分页移到swap空间。
第三行表示swap的使用:
used——已使用
free——未使用
与文件系统打交道的,一般都是磁盘,磁盘的效率可以说是最差的(CPU>CPU缓存>内存>磁盘), 但是在开发时,处处离不开磁盘,如读写文件、打印日志等。都是在涉及到磁盘的操作,在性能优化中,磁盘的优化是非常重要的一环。
5.1系统参数调优脏页背景阈值调整:当脏页数据还达到阈值将会刷新磁盘。正常是10%写入磁盘,修改文件/proc/sys/vm/dirty_background_ratio来调整该值。
脏页刷新定时器调整:当页高速缓存中有脏页,且很久没刷新时,由wb_timer动态定时器刷新。通常是500分之一秒,不过可以通过修改/proc/sys/vm/dirty_writeback_centisecs文件调整该值
其他的参数,请查看: /proc/sys/vm/dirty_* 中的文件
5.2 应用程序性能优化在就用程序中,如果涉及到磁盘的操作,比如:数据库,本地文件等。可以在中间添加一层缓存,也可直接用缓存数据库等,避免直接接作磁盘。
- 在架构设计时,添加一个缓存层(redis/memcached/直接内存)等
- 把数据放在缓存层中
- 采用定时刷新的方法,把更改未同步的数据刷新到数据库或本地文件
- 如果重要的数据,可直接刷新缓存后同步
目前的系统架构设计中,都会添加缓存层,因为缓存层的效率非常高,对于高并发的设计更是如些。因此缓存的思想是非常重要的。
今天的分享到这,如果有写的有错误的地方,欢迎指正。同时希望志同道合的人一起来交流,进步。