Linux系统运维: Systemd 应用
Systemd 是 Linux 系统工具,用来启动守护进程 ,已成为大多数发行版的标准配置。
本文介绍它的基本用法、主要命令以及如何用于实战。
1. 由来
下面的命令用来启动服务。
|
|
这种方法有两个缺点。
一是启动时间长。init
进程是串行启动,只有前一个进程启动完,才会启动下一个进程。
二是启动脚本复杂。init
进程只是执行启动脚本,不管其他事情。脚本需要自己处理各种
情况,这往往使得脚本变得很长。
2. Systemd 概述
Systemd 就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套 完整的解决方案。
根据 Linux 惯例,字母d
是守护进程(daemon)的缩写。 Systemd 这个名字的含义,就
是它要守护整个系统。
使用了 Systemd,就不需要再用init
了。Systemd 取代了initd
,成为系统的第一个进
程(PID 等于 1),其他进程都是它的子进程。
|
|
上面的命令查看 Systemd 的版本。
Systemd 的优点是功能强大,使用方便,缺点是体系庞大,非常复杂。事实上,现在还有很 多人反对使用 Systemd,理由就是它过于复杂,与操作系统的其他部分强耦合,违反"keep simple, keep stupid" 的Unix 哲学 。
(上图为 Systemd 架构图)
3. 系统管理
Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。
3.1. systemctl
systemctl
是 Systemd 的主命令,用于管理系统。
|
|
3.2. systemd-analyze
systemd-analyze
命令用于查看启动耗时。
|
|
3.3. hostnamectl
hostnamectl
命令用于查看当前主机的信息。
|
|
3.4. localectl
localectl
命令用于查看本地化设置。
|
|
3.5. timedatectl
timedatectl
命令用于查看当前时区设置。
|
|
3.6. loginctl
loginctl
命令用于查看当前登录的用户。
|
|
4. Unit
4.1. 含义
Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。
Unit 一共分成 12 种。
- Service unit:系统服务
- Target unit:多个 Unit 构成的一个组
- Device Unit:硬件设备
- Mount Unit:文件系统的挂载点
- Automount Unit:自动挂载点
- Path Unit:文件或路径
- Scope Unit:不是由 Systemd 启动的外部进程
- Slice Unit:进程组
- Snapshot Unit:Systemd 快照,可以切回某个快照
- Socket Unit:进程间通信的 socket
- Swap Unit:swap 文件
- Timer Unit:定时器
systemctl list-units
命令可以查看当前系统的所有 Unit 。
|
|
4.2. Unit 的状态
systemctl status
命令用于查看系统状态和单个 Unit 的状态。
|
|
除了status
命令,systemctl
还提供了三个查询状态的简单方法,主要供脚本内部的判
断语句使用。
|
|
4.3. Unit 管理
对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)。
|
|
4.4. 依赖关系
Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启 动 B。
systemctl list-dependencies
命令列出一个 Unit 的所有依赖。
|
|
上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如
果要展开 Target,就需要使用--all
参数。
|
|
5. Unit 的配置文件
5.1. 概述
每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。
Systemd 默认从目录/etc/systemd/system/
读取配置文件。但是,里面存放的大部分文件
都是符号链接,指向目录/usr/lib/systemd/system/
,真正的配置文件存放在那个目录。
systemctl enable
命令用于在上面两个目录之间,建立符号链接关系。
|
|
如果配置文件里面设置了开机启动,systemctl enable
命令相当于激活开机启动。
与之对应的,systemctl disable
命令用于在两个目录之间,撤销符号链接关系,相当于
撤销开机启动。
|
|
配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket
。如果省略,Systemd 默认
后缀名为.service
,所以sshd
会被理解成sshd.service
。
5.2. 配置文件的状态
systemctl list-unit-files
命令用于列出所有配置文件。
|
|
这个命令会输出一个列表。
|
|
这个列表显示每个配置文件的状态,一共有四种。
- enabled:已建立启动链接
- disabled:没建立启动链接
- static:该配置文件没有
[Install]
部分(无法执行),只能作为其他配置文件的依赖 - masked:该配置文件被禁止建立启动链接
注意,从配置文件的状态无法看出,该 Unit 是否正在运行。这必须执行前面提到
的systemctl status
命令。
|
|
一旦修改配置文件,就要让 SystemD 重新加载配置文件,然后重新启动,否则修改不会生 效。
|
|
5.3. 配置文件的格式
配置文件就是普通的文本文件,可以用文本编辑器打开。
systemctl cat
命令可以查看配置文件的内容。
|
|
从上面的输出可以看到,配置文件分成几个区块。每个区块的第一行,是用方括号表示的区
别名,比如[Unit]
。注意,配置文件的区块名和字段名,都是大小写敏感的。
每个区块内部是一些等号连接的键值对。
|
|
注意,键值对的等号两侧不能有空格。
5.4. 配置文件的区块
[Unit]
区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他
Unit 的关系。它的主要字段如下。
Description
:简短描述Documentation
:文档地址Requires
:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败Wants
:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败BindsTo
:与Requires
类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行Before
:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动After
:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动Conflicts
:这里指定的 Unit 不能与当前 Unit 同时运行Condition...
:当前 Unit 运行必须满足的条件,否则不会运行Assert...
:当前 Unit 运行必须满足的条件,否则会报启动失败
[Install]
通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它
的主要字段如下。
WantedBy
:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放 入/etc/systemd/system
目录下面以 Target 名 +.wants
后缀构成的子目录中RequiredBy
:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放 入/etc/systemd/system
目录下面以 Target 名 +.required
后缀构成的子目录中Alias
:当前 Unit 可用于启动的别名Also
:当前 Unit 激活(enable)时,会被同时激活的其他 Unit
[Service]
区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的
主要字段如下。
Type
:定义启动时的进程行为。它有以下几种值。Type=simple
:默认值,执行ExecStart
指定的命令,启动主进程Type=forking
:以 fork 方式从父进程创建子进程,创建后父进程会立即退出Type=oneshot
:一次性进程,Systemd 会等当前服务退出,再继续往下执行Type=dbus
:当前服务通过 D-Bus 启动Type=notify
:当前服务启动完毕,会通知Systemd
,再继续往下执行Type=idle
:若有其他任务执行完毕,当前服务才会运行ExecStart
:启动当前服务的命令ExecStartPre
:启动当前服务之前执行的命令ExecStartPost
:启动当前服务之后执行的命令ExecReload
:重启当前服务时执行的命令ExecStop
:停止当前服务时执行的命令ExecStopPost
:停止当其服务之后执行的命令RestartSec
:自动重启当前服务间隔的秒数Restart
:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always
(总是 重启)、on-success
、on-failure
、on-abnormal
、on-abort
、on-watchdog
TimeoutSec
:定义 Systemd 停止当前服务之前等待的秒数Environment
:指定环境变量
Unit 配置文件的完整字段清单,请参 考官方文档 。
6. Target
启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要 哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。
简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候 ,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点 “,启动某个 Target 就好比启动到某种状态。
传统的init
启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是
,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动
。
|
|
Target 与 传统 RunLevel 的对应关系如下。
|
|
它与init
进程的主要差别如下。
(1)默认的 RunLevel(在/etc/inittab
文件设置)现在被默认的 Target 取代,
位置是/etc/systemd/system/default.target
,通常符号链接到graphical.target
(
图形界面)或者multi-user.target
(多用户命令行)。
(2)启动脚本的位置,以前是/etc/init.d
目录,符号链接到不同的 RunLevel 目
录 (比如/etc/rc3.d
、/etc/rc5.d
等),现在则存放
在/lib/systemd/system
和/etc/systemd/system
目录。
(3)配置文件的位置,以前init
进程的配置文件是/etc/inittab
,各种服务的
配置文件存放在/etc/sysconfig
目录。现在的配置文件主要存放在/lib/systemd
目录
,在/etc/systemd
目录里面的修改可以覆盖原始设置。
7. 日志管理
Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl
一个命
令,查看所有日志(内核日志和应用日志)。日志的配置文件
是/etc/systemd/journald.conf
。
journalctl
功能强大,用法非常多。
|
|
8. 实战
8.1. 开机启动
对于那些支持 Systemd 的软件,安装的时候,会自动在/usr/lib/systemd/system
目录添
加一个配置文件。
如果你想让该软件开机启动,就执行下面的命令(以httpd.service
为例)。
|
|
上面的命令相当于在/etc/systemd/system
目录添加一个符号链接,指
向/usr/lib/systemd/system
里面的httpd.service
文件。
这是因为开机时,Systemd
只执行/etc/systemd/system
目录里面的配置文件。这也意味
着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。
8.2. 启动服务
设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件
,那么要执行systemctl start
命令。
|
|
执行上面的命令以后,有可能启动失败,因此要用systemctl status
命令查看一下该服务
的状态。
|
|
上面的输出结果含义如下。
Loaded
行:配置文件的位置,是否设为开机启动Active
行:表示正在运行Main PID
行:主进程 IDStatus
行:由应用本身(这里是 httpd )提供的软件当前状态CGroup
块:应用的所有子进程- 日志块:应用的日志
8.3. 停止服务
终止正在运行的服务,需要执行systemctl stop
命令。
|
|
有时候,该命令可能没有响应,服务停不下来。这时候就不得不"杀进程"了,向正在运行的
进程发出kill
信号。
|
|
此外,重启服务要执行systemctl restart
命令。
|
|
8.4. 读懂配置文件
一个服务怎么启动,完全由它的配置文件决定。下面就来看,配置文件有些什么内容。
前面说过,配置文件主要放在/usr/lib/systemd/system
目录,也可能
在/etc/systemd/system
目录。找到配置文件以后,使用文本编辑器打开即可。
systemctl cat
命令可以用来查看配置文件,下面以sshd.service
文件为例,它的作用
是启动一个 SSH 服务器,供其他用户以 SSH 方式登录。
|
|
可以看到,配置文件分成几个区块,每个区块包含若干条键值对。
下面依次解释每个区块的内容。
8.5. [Unit] 区块:启动顺序与依赖关系。
Unit
区块的Description
字段给出当前服务的简单描述,Documentation
字段给出文档
位置。
接下来的设置是启动顺序和依赖关系,这个比较重要。
After
字段:表示如果network.target
或sshd-keygen.service
需要启动,那 么sshd.service
应该在它们之后启动。
相应地,还有一个Before
字段,定义sshd.service
应该在哪些服务之前启动。
注意,After
和Before
字段只涉及启动顺序,不涉及依赖关系。
举例来说,某 Web 应用需要 postgresql 数据库储存数据。在配置文件中,它只定义要在 postgresql 之后启动,而没有定义依赖 postgresql 。上线后,由于某种原因 ,postgresql 需要重新启动,在停止服务期间,该 Web 应用就会无法建立数据库连接。
设置依赖关系,需要使用Wants
字段和Requires
字段。
Wants
字段:表示sshd.service
与sshd-keygen.service
之间存在"弱依赖"关系,即 如果"sshd-keygen.service"启动失败或停止运行,不影响sshd.service
继续执行。
Requires
字段则表示"强依赖"关系,即如果该服务启动失败或异常退出,那
么sshd.service
也必须退出。
注意,Wants
字段与Requires
字段只涉及依赖关系,与启动顺序无关,默认情况下是同
时启动的。
8.6. [Service] 区块:启动行为
Service
区块定义如何启动当前服务。
8.6.1. 启动命令
许多软件都有自己的环境参数文件,该文件可以用EnvironmentFile
字段读取。
EnvironmentFile
字段:指定当前服务的环境参数文件。该文件内部的key=value
键值 对,可以用$key
的形式,在当前配置文件中获取。
上面的例子中,sshd 的环境参数文件是/etc/sysconfig/sshd
。
配置文件里面最重要的字段是ExecStart
。
ExecStart
字段:定义启动进程时执行的命令。
上面的例子中,启动sshd
,执行的命令是/usr/sbin/sshd -D $OPTIONS
,其中的变
量$OPTIONS
就来自EnvironmentFile
字段指定的环境参数文件。
与之作用相似的,还有如下这些字段。
ExecReload
字段:重启服务时执行的命令ExecStop
字段:停止服务时执行的命令ExecStartPre
字段:启动服务之前执行的命令ExecStartPost
字段:启动服务之后执行的命令ExecStopPost
字段:停止服务之后执行的命令
请看下面的例子。
|
|
上面这个配置文件,第二行ExecStart
设为空值,等于取消了第一行的设置,运行结果如
下。
|
|
所有的启动设置之前,都可以加上一个连词号(-
),表示"抑制错误”,即发生错误的时
候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/sysconfig/sshd
(注意等号
后面的那个连词号),就表示即使/etc/sysconfig/sshd
文件不存在,也不会抛出错误。
8.6.2. 启动类型
Type
字段定义启动类型。它可以设置的值如下。
- simple(默认值):
ExecStart
字段启动的进程为主进程 - forking:
ExecStart
字段将以fork()
方式启动,此时父进程将会退出,子进程将成 为主进程 - oneshot:类似于
simple
,但只执行一次,Systemd 会等它执行完,才启动其他服务 - dbus:类似于
simple
,但会等待 D-Bus 信号后启动 - notify:类似于
simple
,启动结束后会发出通知信号,然后 Systemd 再启动其他服 务 - idle:类似于
simple
,但是要等到其他任务都执行完,才会启动该服务。一种使用场 合是为让该服务的输出,不与其他服务的输出相混合
下面是一个oneshot
的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写
。
|
|
上面的配置文件,启动类型设为oneshot
,就表明这个服务只要运行一次就够了,不需要
长期运行。
如果关闭以后,将来某个时候还想打开,配置文件修改如下。
|
|
上面配置文件中,RemainAfterExit
字段设为yes
,表示进程退出以后,服务仍然保持执
行。这样的话,一旦使用systemctl stop
命令停止服务,ExecStop
指定的命令就会执行
,从而重新开启触摸板。
8.6.3. 重启行为
Service
区块有一些字段,定义了重启行为。
KillMode
字段:定义 Systemd 如何停止 sshd 服务。
上面这个例子中,将KillMode
设为process
,表示只停止主进程,不停止任何 sshd 子
进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重
要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。
KillMode
字段可以设置的值如下。
- control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
- process:只杀主进程
- mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
- none:没有进程会被杀掉,只是执行服务的 stop 命令。
接下来是Restart
字段。
Restart
字段:定义了 sshd 退出后,Systemd 的重启方式。
上面的例子中,Restart
设为on-failure
,表示任何意外的失败,就将重启 sshd。如果
sshd 正常停止(比如执行systemctl stop
命令),它就不会重启。
Restart
字段可以设置的值如下。
- no(默认值):退出后不会重启
- on-success:只有正常退出时(退出状态码为 0),才会重启
- on-failure:非正常退出时(退出状态码非 0),包括被信号终止和超时,才会重启
- on-abnormal:只有被信号终止和超时,才会重启
- on-abort:只有在收到没有捕捉到的信号终止时,才会重启
- on-watchdog:超时退出,才会重启
- always:不管是什么退出原因,总是重启
对于守护进程,推荐设为on-failure
。对于那些允许发生错误退出的服务,可以设
为on-abnormal
。
最后是RestartSec
字段。
RestartSec
字段:表示 Systemd 重启服务之前,需要等待的秒数。上面的例子设为等 待 42 秒。
8.7. [Install] 区块
Install
区块,定义如何安装这个配置文件,即怎样做到开机启动。
WantedBy
字段:表示该服务所在的 Target。
Target
的含义是服务组,表示一组服务。WantedBy=multi-user.target
指的是,sshd
所在的 Target 是multi-user.target
。
这个设置非常重要,因为执行systemctl enable sshd.service
命令时
,sshd.service
的一个符号链接,就会放在/etc/systemd/system
目录下面
的multi-user.target.wants
子目录之中。
Systemd 有默认的启动 Target。
|
|
上面的结果表示,默认的启动 Target 是multi-user.target
。在这个组里的所有服务,
都将开机启动。这就是为什么systemctl enable
命令能设置开机启动的原因。
使用 Target 的时候,systemctl list-dependencies
命令和systemctl isolate
命令也
很有用。
|
|
一般来说,常用的 Target 有两个:一个是multi-user.target
,表示多用户命令行状态
;另一个是graphical.target
,表示图形用户状态,它依赖于multi-user.target
。官
方文档有一张非常清晰的
Target 依赖关系图
。
8.8. Target 的配置文件
Target 也有自己的配置文件。
|
|
注意,Target 配置文件里面没有启动命令。
上面输出结果中,主要字段含义如下。
Requires
字段:要求basic.target
一起运行。Conflicts
字段:冲突字段。如果rescue.service
或rescue.target
正在运行 ,multi-user.target
就不能运行,反之亦然。After
:表示multi-user.target
在basic.target
、rescue.service
、rescue.target
之后启动,如果它们有启动的话。AllowIsolate
:允许使用systemctl isolate
命令切换到multi-user.target
。
8.9. 修改配置文件后重启
修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。
|
|