Docker容器数据持久化

容器中的数据可以存储在容器层。但是将数据存放在容器层存在以下问题:

  • 数据不是持久化。意思是如果容器删除了,这些数据也就没了
  • 主机上的其它进程不方便访问这些数据
  • 对这些数据的I/O会经过存储驱动,然后到达主机,引入了一层间接层,因此性能会有所下降

Docker提供了3种持久化数据的方式:

  1. volumes:存于主机文件系统中的某个区域,由Docker管理(/var/lib/docker/volumes/ on linux)。非Docker进程不应该修改这些数据。卷是Docker中持久化数据的最好方式
  2. bind mount:存于主机文件系统中的任意位置。非Docker进程可以修改这些数据
  3. tmpfs mount(Linux中):存于内存中(注意,并不是持久化到磁盘)。在容器的生命周期中,它能被容器用来存放非持久化的状态或敏感信息


volumes

如果没有显式创建,一个卷会在最开始挂载时被创建。当容器停止时,卷仍然存在。多个容器可以通过read-write或read-only的方式使用同一个卷。只有在显式删除时,卷才会被删除。如果将一个空卷挂载到容器中一个存有文件或目录的目录中,这些文件或目录会被拷贝到空卷中;如果将一个非空卷挂载到容器中一个存有文件或目录的目录中,这些文件或目录会被隐藏

使用

  • 创建:docker volume create
  • 删除某个卷:docker volume rm 卷名
  • 删除所有未使用的卷:docker volume prune
  • 列出所有卷:docker volume ls
  • 查看某个卷的信息:docker volume inspect 卷名
  • 挂载到容器:-v--volume。如果是Docker17.06或更高:推荐使用--mount。(同 bind mount
    • -v--volume:由3个域组成,':'分隔
      • 第一个域:对于命名卷,为卷名;匿名卷,则忽略,此时会创建匿名卷
      • 第二个域:容器中的挂载点
      • 第三个域:可选参数,由','隔开,如ro
    • --mount:由多个','隔开的键值对<key>=<value>组成:
      • 挂载类型:key为type,value为bindvolumetmpfs
      • 挂载源:key为sourcesrc,对于命名卷,value为卷名,对于匿名卷,则忽略
      • 容器中的挂载点:key为destinationdsttarget,value为容器中的路径
      • 读写类型:value为readonly,没有key
      • 读写类型:value为readonly,没有key
      • volume-opt选项,可以出现多次。比如volume-driver=local,volume-opt=type=nfs,...

当使用docker service create 启动Docker服务时,只支持--mount,不支持-v--volume。并且每个服务容器使用它们各自的本地卷,因此如果使用本地(local)卷驱动,容器无法通过卷共享数据,但是一些卷驱动支持共享存储。Docker for AWS和Doocker for Azure都使用Cloundstor plugin支持持久存储

场景

  • 多个运行容器间共享数据
  • 当Docker主机不确保具有给定的目录或文件时。卷可以将容器运行时与Docker主机的配置解耦合
  • 备份、恢复、或将数据从一个Docker主机迁移到另一个Docker主机时


bind mount

主机中的文件或目录通过全路径被引用。在使用绑定挂载时,这些目录或文件不一定要已经存在。如果使用这种方式将一个目录挂载到容器中一个存有文件或目录的目录中,这些文件或目录会被隐藏;如果主机中的文件或目录不存在,当使用--mount挂载时,Docker会报错,当使用-v--volume时,会在主机上创建目录

使用

  • 挂载到容器:-v--volume。如果是Docker17.06或更高:推荐使用--mount。(同 volumes
    • -v--volume:由3个域组成,':'分隔
      • 第一个域:主机上文件或目录的路径
      • 第二个域:容器中的挂载点
      • 第三个域:可选参数,由','隔开,如roconsistentdelegatedcachedzZ
    • --mount:由多个','隔开的键值对<key>=<value>组成:
      • 挂载类型:key为type,value为bindvolumetmpfs
      • 挂载源:key为sourcesrc,value为主机中文件或目录的路径
      • 容器中的挂载点:key为destinationdsttarget,value为容器中的路径
      • 读写类型:value为readonly,没有key
      • bind-propagation选项:key为bind-propagationvaluerprivateprivatersharedsharedrslaveslave
      • 一致性选项:value为consistentdelegatedcached。这个选项仅仅适用于Docker for Mac
      • --mount不支持zZ(这个不同于-v--volume

场景

大体上来说,只要可能,最好使用volumes

  • 主机与容器共享配置文件(Docker默认情况下通过这种方式为容器提供DNS解析,通过将/etc/resolv.conf挂载到容器中)
  • 共享源代码或build artifacts(比如将Maven的target/目录挂载到容器中,每次在Docker主机中build Maven工程时,容器能够访问到那些rebuilt artifacts)
  • 当Docker主机中的文件或目录结构和容器需要的一致时

bind propagation

对于bind mountvolumes,默认都是rprivate。只有在使用bind mount时可配置,且必须在linux下。bind propagation是个超前主题,对于大多数用户来说,并不需要配置

对于一个挂载点/mnt,假设它同时也被挂载到/tmp。bind propagation控制 whether a mount on /tmp/a would also be available on /mnt/a

Propagation setting Description
shared 原挂载点(上面的/mnt)中的所有子挂载点对于副本挂载点(上面的/tmp)可见,副本挂载点中的所有子挂载点对于原挂载点也可见
slave shared相似,但是只有1个方向:原挂载点中的所有子挂载点对于副本挂载点可见。反过来不行
private 原挂载点和副本挂载点中的子挂载点对只有自己可见
rshared shared相同,but the propagation also extends to and from mount points nested within any of the original or replica mount points
rslave slave相同,but the propagation also extends to and from mount points nested within any of the original or replica mount points
rprivate 默认值。和private相同

在设置bind propagation之前,主机文件系统需要支持bind propagation

下面的例子将主机中的target/挂载到容器中2次:

1
2
3
4
5
6
docker run -d \
-it \
--name devtest \
--mount type=bind,source="$(pwd)"/target,target=/app \
--mount type=bind,source="$(pwd)"/target,target=/app2,readonly,bind-propagation=rslave \
nginx:latest

此时如果创建/app/foo//app2/foo也会存在

selinux label

你能添加zZ选项来修改挂载到容器中的主机文件或目录的selinux label:

  • z选项指明bind mount的内容在多个容器间是共享的
  • Z选项指明bind mount的内容是私有不共享的

要特别小心的使用这两个选项。”Bind-mounting a system directory such as /home or /usr with the Z option renders your host machine inoperable and you may need to relabel the host machine files by hand”


tmpfs mount

只在linux中支持

相对于volumesbind mounttmpfs mount是临时的,只在主机内存中持久化。当容器停止,tmpfs mount会被移除。对于临时存放敏感文件很有用

不同于volumesbind mount,多个容器无法共享tmpfs mount

使用

  • 挂载到容器:--tmpfs。如果是Docker17.06或更高:推荐使用--mount
    • --tmpfs:直接指定容器中的挂载点。不允许指定任何配置选项
    • --mount:由多个','隔开的键值对<key>=<value>组成:
      • 挂载类型:key为type,value为bindvolumetmpfs
      • 容器中的挂载点:key为destinationdsttarget,value为容器中的路径
      • tmpfs-sizetmpfs-mode选项
Option Description
tmpfs-size tmpfs mount的大小,默认值为不受限制
tmpfs-mode 八进制的文件模式。比如,7000700。默认为1777或world-writable

场景

  • 最好的使用场景是你既不想将数据存于主机,又不想存于容器中时。这可以是出于安全的考虑,或当应用需要写大量非持久性的状态数据时为了保护容器的性能


volume drivers

机器间共享数据

当构建错误容忍应用时,可能需要配置同一个服务的多个副本来访问相同的文件:

有多种方法来实现这个目的:

  • 为应用添加逻辑,将文件存储到一个云对象存储系统(如Amazon S3)中
  • 使用一个支持将文件写入外部存储系统(如NFS或Amazon S3)的driver来创建卷

volume drivers可以将底层存储系统从应用逻辑中抽象出来。比如,如果你的服务使用一个具有NFS driver的卷,你能更新你的服务使用不同的driver,作为在云中存储数据的示例,而不更改应用程序逻辑

使用

在使用docker volume create或驱动容器创建匿名卷时,可以指定一个volume drivers。下面的例子使用vieux/sshfs作为volume drivers

假设有2个节点,第一个节点是Docker主机,它能SSH到第二个节点

  1. 在Docker主机中,安装vieux/sshfs插件
1
docker plugin install --grant-all-permissions vieux/sshfs
  1. 使用卷驱动创建卷

1)创建命名卷

1
2
3
4
docker volume create --driver vieux/sshfs \
-o sshcmd=test@node2:/home/test \
-o password=testpassword \
sshvolume

2)启动容器时使用卷驱动创建匿名卷

1
2
3
4
5
docker run -d \
--name sshfs-container \
--volume-driver vieux/sshfs \
--mount src=sshvolume,target=/app,volume-opt=sshcmd=test@node2:/home/test,volume-opt=password=testpassword \
nginx:latest
  1. 备份、恢复、迁移数据卷

1)备份一个容器

1
docker run --rm --volumes-from dbstore -v $(pwd):/backup ubuntu tar cvf /backup/backup.tar /dbdata
  • 启动一个新容器,挂载dbstore容器中的卷
  • 挂载一个本地主机目录到容器/backup
  • 使用tardbdata卷中的数据打包成backup.tar

2)用备份恢复容器

使用刚刚创建的备份来恢复容器:

1
docker run -v /dbdata --name dbstore2 ubuntu /bin/bash

然后,在新创建的容器的卷中使用tar解包备份的数据:

1
docker run --rm --volumes-from dbstore2 -v $(pwd):/backup ubuntu bash -c "cd /dbdata && tar xvf /backup/backup.tar --strip 1"


参考

文章目录
  1. 1. volumes
    1. 1.1. 使用
    2. 1.2. 场景
  2. 2. bind mount
    1. 2.1. 使用
    2. 2.2. 场景
    3. 2.3. bind propagation
    4. 2.4. selinux label
  3. 3. tmpfs mount
    1. 3.1. 使用
    2. 3.2. 场景
  4. 4. volume drivers
    1. 4.1. 使用
  5. 5. 参考
|