Context
容器的定义:容器是为了解决“在切换运行环境时,如何保证软件能够正常运行”这一问题。
目前,容器和 Docker 依旧是技术领域最热门的词语,无状态的服务容器化已经是大势所趋,同时也带来了一个热点问题被大家所争论不以:数据库 MySQL 是否需要容器化?
下面,我们就聊一下 Docker 不适合跑 MySQL 的 N 个原因!
数据安全问题
不要将数据储存在容器中,这也是 Docker 官方容器使用技巧中的一条。容器随时可以停止、或者删除。当容器被rm掉,容器里的数据将会丢失。为了避免数据丢失,用户可以使用数据卷挂载来存储数据。但是容器的 Volumes 设计是围绕 Union FS 镜像层提供持久存储,数据安全缺乏保证。如果容器突然崩溃,数据库未正常关闭,可能会损坏数据。另外,容器里共享数据卷组,对物理机硬件损伤也比较大。
性能问题
大家都知道,MySQL 属于关系型数据库,对IO要求较高。当一台物理机跑多个时,IO就会累加,导致IO瓶颈,大大降低 MySQL 的读写性能。
其实也有相对应的一些策略来解决这个问题,比如:
1)数据库程序与数据分离
如果使用Docker 跑 MySQL,数据库程序与数据需要进行分离,将数据存放到共享存储,程序放到容器里。如果容器有异常或 MySQL 服务异常,自动启动一个全新的容器。另外,建议不要把数据存放到宿主机里,宿主机和容器共享卷组,对宿主机损坏的影响比较大。
2)跑轻量级或分布式数据库
Docker 里部署轻量级或分布式数据库,Docker 本身就推荐服务挂掉,自动启动新容器,而不是继续重启容器服务。
3)合理布局应用
对于IO要求比较高的应用或者服务,将数据库部署在物理机或者KVM中比较合适。目前腾讯云的TDSQL和阿里的Oceanbase都是直接部署在物理机器,而非Docker 。
资源隔离方面
资源隔离方面,Docker 确实不如虚拟机KVM,Docker是利用Cgroup实现资源限制的,只能限制资源消耗的最大值,而不能隔绝其他程序占用自己的资源。如果其他应用过渡占用物理机资源,将会影响容器里 MySQL 的读写效率。
需要的隔离级别越多,获得的资源开销就越多。相比专用环境而言,容易水平伸缩是Docker的一大优势。然而在 Docker 中水平伸缩只能用于无状态计算服务,数据库并不适用。
Reference
- https://mp.weixin.qq.com/s/ctCJxCQ6snT0TPo44A3opQ
- https://www.reddit.com/r/docker/comments/amo2cc/running_production_databases_in_docker/
- https://devops.stackexchange.com/questions/1293/what-are-the-reasons-docker-should-not-be-used-for-databases
- https://www.infoq.cn/article/can-mysql-run-in-docker
- https://patrobinson.github.io/2016/11/07/thou-shalt-not-run-a-database-inside-a-container/
- https://eng.uber.com/dockerizing-mysql/
- https://www.quora.com/Is-it-not-advisable-to-use-database-in-Docker-container
- https://dzone.com/articles/the-pros-and-cons-of-running-production-databases