虚拟内存和 mmap

文章目录

一、虚拟内存
二、mmap

在工作中偶尔会听到 mmap 这个词。首先从出处上来说，mmap()是在 <sys/mman.h> 中定义的一个函数，此函数的作用是创建一个新的 虚拟内存 区域，并将指定的对象映射到此区域。因此，一直以来在工作中聊到的 mmap 其实就是通过 内存映射 的机制来进行文件操作。

由于从定义上来说提到了虚拟内存，接下来先简单说一下 虚拟内存 。

一、虚拟内存

虚拟内存 是一种性能优越的内存管理技术。首先它为程序提供了看似巨大的内存空间，使得一个较大的程序能够运行在较小的内存空间中；同时又为每个进程提供了独立的虚拟地址空间，既简化了内存管理，也保护了每个进程的地址空间。

1.1 局部性

要实现虚拟内存的机制，首先不得不说其基础 局部性 。即在一个较短的时间内，执行的程序指令、访问的数据空间只会局限于某个区域；某条指令、数据在被访问后，不久后可能再次被访问，其附近的指令、数据也可能将被访问。

因此可以 将主存看作磁盘的高速缓存，只在主存中保存当前活动的指令和数据，然后根据需要在主存和磁盘之间来回传输数据 。

1.2 页表

为了在磁盘（虚拟内存）和主存（物理内存）之间更高效地来回传送数据，系统将虚拟内存以及物理内存按照 固定、相同 的大小分割为一个个的页，虚拟内存上的称为 虚拟页 ，而物理内存上的称为 物理页 。

在切分好页后，系统还在主存中用一个页表来记录下当前每个虚拟页的情况，包括这个虚拟页是否已被分配使用、是否已被缓存到物理内存中等。简化的页表如下图。

页表中每一项称为 页表项（Page Table Entry) ，PTE 中最重要的两个信息是 有效位 和地址。

当 有效位 被设置，则表示此虚拟页当前已被缓存到物理内存中，此时地址将指向其缓存到的物理页起始位置；

当 有效位 未被设置，如果该虚拟页已分配，则此时地址指向其虚拟页在磁盘中的起始位置，否则地址为 null。

1.3 缺页

虚拟内存和物理内存之间的数据传送正是发生于缺页。

如上图，当 CPU 首次访问 PTE 1，发现页表中的有效位仍 未被设置 ，即判断出对应的数据（VP1）仍未被缓存到物理内存中，从而触发了 缺页异常 ，将 VP1 从 虚拟内存 拷贝到 物理内存 中。而图中可以发现此时物理内存已经满了，则会通过 LRU 等算法将物理内存中的某个物理页（假设是VP3）替换掉。因此在缺页异常发生后，上面的页表将会更新为下图的样子。

1.4 多进程

上面展示的都是单进程的情况，其实系统为 每个进程 都提供了一个 独立的页表 ，也就是独立的虚拟地址空间，从而能够很好地保护每个进程的数据。

二、mmap

了解完 虚拟内存 ，再回过头来讲一下 mmap ，也就是内存映射。内存映射是将一个虚拟内存区域与一个磁盘上的对象关联起来，以初始化这个虚拟内存区域的内容的过程。

2.1 基础概念

先讲下内存映射里的一些概念。

映射对象类型

虚拟内存区域可以映射以下两种类型的对象：

普通文件：即磁盘文件中的一块连续的区域。
匿名文件：一个由内核创建的全为 二进制零 的文件。当CPU首次引用此区域时，将以二进制零填充到页表中。

共享对象

在上一节 虚拟内存 可得知，系统为每个进程提供了单独的页表，从而也实现了进程间数据访问权限的管理以及数据的保护。但同时，通过内存映射的机制，将对象作为 共享对象 映射到两个进程的虚拟内存亦可实现数据的共享。

2.2 使用方式

然后先讲下如果我们应该如何通过内存映射的方式来访问文件。 mmap() 的函数定义如下：

void * mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset)

其中参数的含义分别是：

start: 期望的进程虚拟内存起始位置，填 NULL 时由内核来决定起始位置
length: 需要映射的对象字节大小
fd: 文件句柄
offset: 距离文件开始处的偏移量
prot: 映射对象的访问权限，用于可指定是否可读写、执行。
flags: 映射对象的类型，例如指定是映射普通文件还是请求二进制零、映射共享对象还是私有的写时复制对象等。

前4项地含义可通过下图更直观地了解：

而在 iOS 开发中，当我们需要的数据类型是 NSData 时，可以更简便地通过调用以下方法

@interface NSData (NSDataCreation)

+ (nullable instancetype)dataWithContentsOfFile:(NSString *)path options:(NSDataReadingOptions)readOptionsMask error:(NSError **)errorPtr;

并传入 NSDataReadingMappedIfSafe 来使用内存映射方式读取文件。

2.3 读取过程

当我们通过 mmap 读取文件时，将经历以下步骤：

在当前用户虚拟内存空间中分配一片 指定映射大小 的虚拟内存区域。
将磁盘中的文件映射到这片内存区域，等待后续按需进行页面调度。
当CPU真正访问数据时，触发 缺页异常 将所需的数据页从磁盘拷贝到物理内存，并将物理页地址记录到页表。
进程通过页表得到的物理页地址访问文件数据。

而作为对比，当通过 标准IO 读取一个文件时，步骤为：

将完整的文件从磁盘拷贝到物理内存（内核空间）。
将完整文件数据从 内核空间 拷贝到 用户空间 以供进程访问。

2.4 优劣

通过上面 mmap 与 标准IO 的对比，不难发现调用mmap具有以下的优势：

物理内存占用延后：数据直到真正被使用时才会发生拷贝。
物理内存占用减少：对于同一份文件无需在物理内存中存放两份，且文件区被划分成片，缺页异常时只将所需的页拷贝到物理内存。
方便实现跨进程数据交互、共享：当映射到虚拟内存的对象被设置为共享对象，则不同进程对映射对象的写操作相互可见。

然而也能发现 mmap 存在以下劣势：

无法映射变长文件：调用mmap()时需指定要映射的文件位置和需要映射的大小范围。
如果需要映射的文件过大，会导致过度占用虚拟内存：在调用mmap()后，虚拟内存空间就创建了，此时虽然不会占用物理内存，但依然会占用虚拟内存。此时可考虑只映射文件中自己需要的部分。

由此，当我们需要访问一个比较大的文件，尤其是当我们只需要访问其中的一小部分数据的时候，我们可以尝试通过 mmap 的方式来进行访问，减少由于该文件过大而对物理内存的过度占用。