shell脚本编程

2022年4月2日 0条评论 961次阅读 0人点赞 captzx

shell脚本编程

工作中使用shell脚本比较多, shell脚本需要注意的细节也比较多, 一不留神就容易出错, 而脚本也没有类似编译器之类的辅助检查, 直接运行可能会导致问题.
此篇文章总结了shell脚本编程的一些知识点, 以便在编写shell脚本时, 通过回顾这些知识点, 能够避免一些常见的错误.

shell环境变量

局部环境变量

var="hello world" # 局部变量, 子shell无法获取var
局部环境变量只对创建它们的shell可见, bash程序执行脚本时将新启一个shell环境, 这意味着执行脚本所在的shell中的局部环境变量在脚本执行过程中是不可见的.

全局环境变量

var="hello world"; export; # 局部变量导出为全局变量, 此时子shell也能获取该变量
全局环境变量对于当前shell和所有生成的子shell都是可见的, 局部环境变量可以通过export命令导出为全局环境变量.

不同shell下的环境变量

子shell可以定义同名变量, 子shell修改变量不会影响到父shell中该变量的值, 即使再次使用export也不行.
printenv命令查看全局环境变量, env命令修改全局环境变量, set命令查看当前shell的所有环境变量, unset命令删除环境变量.

执行set | less可以发现系统启动就已经预定义了非常多的环境变量如: HOME,PATH..., 它们通过执行环境文件时设置.

shell环境文件

shell通过执行环境文件(通常是脚本), 为系统设置初始环境变量. 启动shell的方式会影响将执行何种环境文件, 也就意味着不同shell环境下环境变量可能不同(用户可能根据不同的喜好, 修改一些环境文件使shell更符合他们的使用习惯).

linux系统上有两类环境文件:
系统环境文件: /etc/profile(执行/etc/profile会间接执行/etc/profile.d目录下所有文件)
用户环境文件: 此类文件若执行, 只会优先选择并执行其中一个文件. 优先级$HOME/.bash_profile(间接执行$HOME/.bashrc) > $HOME/.bash_login > $HOME/.profile

不同shell启动方式的区别

是否使用或何时使用这些文件和shell的启动方式有关, 启动shell的方式有以下三种:

登录shell(一般情况), 此时先执行/etc/profile, 然后在执行$HOME目录下的用户环境文件, 按优先级选择执行
非登录的交互式shell(执行bash命令的情况), 此时会直接执行$HOME/.bashrc
运行脚本的非交互shell(脚本中启动子shell): 此时不会执行任何环境文件, 它的环境变量全部继承自父shell, 另外会查看BASH_ENV环境变量(一般为空), 若有则执行其指定的环境文件.
由此可以知道, 在shell脚本执行时, 哪些环境变量是可用的(系统环境变量, 用户定义的全局变量等)

保存环境变量

存到$HOME/.bashrc(推荐): 在该文件存储个人使用的环境变量.
存到/etc/profile: 该文件升级系统会被更新, 所以设置可能会被覆盖. 最好在/etc/profile.d目录创建一个sh脚本, 把所有新的和修改过的全局变量放在这里.

shell脚本语法

脚本解释器

shell脚本文件第一行#!/bin/bash用于标识使用/bin/bash来处理文件中的内容.
更一般的用法, 使用#!指定其他解释器来执行脚本, 例如若文件的第一行是#!/usr/bin/python, 则标识文件为为python脚本. 需要注意#!必须在第一行, 解释器必须为绝对路径.
执行脚本需要可执行权限, 也可以使用相应的解释器将脚本文件作为参数来执行脚本.
命令行参数

在脚本中获取命令行参数

$0是程序名, $1是第一个参数, $n是第n个参数(n>9时则需要使用\${n}).
另外, $#命令行参数的个数, ${!#}获取最后一个参数, $*会将命令行上提供的所有参数当作一个单词保存, $@变量会将命令行上提供的所有参数当作同一字符串中的多个独立的单词

处理命令行参数

shift命令, 跳过不需要的参数, 此命令在做参数处理是很好用
```
while [ -n "$1" ]; do
    case "$1" in
        --option ) command ;;
        # 如果有参数, 通过$2获取参数后shift一次
        --option_with_param ) command $2; shift ;;
        * ) ;;
    esac
    shift # 参数处理后shift, $1将获取下一个参数
done
```
变量

变量赋值

var="hello world"
需要注意等号前后不要有空格, 否则就会被处理成命令
变量的类型会根据值自动决定

变量取值

echo $var # 等价于echo ${var}
通过在变量前加上$符号来读取变量值, 有时候需要加上花括号${var}用以标识变量

变量取值的同时可以做一些处理, 如下:
若parameter不存在或为空时
${parameter:-word} 展开结果为word
${parameter:=word} 展开结果为word, 并且将word赋值给parameter(特殊参数不能以这种方式赋值)
${parameter:?word} 脚本错误退出, 并且word的内容会发送到标准错误)

若parameter有值, 则展开结果为word, parameter本身不会被改变
${parameter:+word}

获取字符串长度
${#parameter}

获取子串
${parameter:offset} offset支持负数, 但负号前需要加空格, 避免和${parameter:-word}混淆
${parameter:offset:length} length必须大于0

清除开头一部分文本
${parameter#pattern} 非贪婪模式
${parameter##pattern} 贪婪模式

清除结尾一部分文本
${parameter%pattern} 非贪婪模式
${parameter%%pattern} 贪婪模式

字符串匹配替换(/string省略掉意味着删除匹配的字符串)
${parameter/pattern/string} 替换一次
${parameter//pattern/string} 替换所有
${parameter/#pattern/string} 替换所有
${parameter/%pattern/string} 匹配头部并替换

大小写转化
${parameter,} 首字符大写
${parameter,,} 全部小写
${parameterˆˆ} 首字符大写
${parameterˆˆ} 全部大写

执行命令结果赋值到变量

var=$(echo "hello world")
通过$(command)将命令包裹, 此时将创建一个子shell来执行命令

有时候直接使用可能有问题, 如下
```
$ var=$(cal); echo $var
January 2022 Su Mo Tu We Th Fr Sa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

$ var=$(cal); echo "$var"
    January 2022
Su Mo Tu We Th Fr Sa
                1
2  3  4  5  6  7  8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
```
大多数情况下, 希望得到的是第二次的执行结果. 为何出这样?
前者展开为很多参数传入echo, 参数之间的空格,制表符,换行符被视为单词之间的界定符, 而后者使用双引号将数据视为一个字符串, 作为一个参数传入echo后被原封不动输出.

关于字符串中的特殊符号展开, 在双引号和单引号中的区别:

使用双引号: 字符串中的美元符号($), 反斜杠()和反引号(`)被视为特殊字符(若要将其看做是普通字符则需要通过\转义), 其他则为普通字符.
使用单引号: 字符串中的所有字符都被视为普通字符.

整数运算结果赋值到变量

var=$[5*2]
同var=$(expr 5*2), 但推荐使用方括号, 此方式只支持整形(浮点数运算使用bc命令)
数组变量

数组变量赋值

array[0]=null
指定元素赋值
array=(zero one two three) # 等价于array=([0]=zero [1]=one [2]=two [3]=three)
同时赋值多个元素
array+=(four)
向数组中追加数据, 注意此处添加括号, 否则array+=four将被理解为对变量array(此时为${array[0]})拼接字符串four, 得到zerofour的错误结果.

数组变量取值时

${array[2]}
获取指定元素
${array[*]} ${array[@]}
获取整个数组
${!array[*]} ${!array[@]}
获取数组元素的下标
*会将命令行上提供的所有参数当作一个单词保存
@会将命令行上提供的所有参数当作同一字符串中的多个独立的单词
${#array[@]}
获取数组变量元素个数
${#array[0]}
获取数组变量中指定元素的长度

数组变量删除

unset array[0]
删除指定元素
unset array
删除整个数组

关联数组

array["element0"]=zero
允许使用字符串作为数组索引
此类数组必须使用declare命令声明declare -A array, 其他操作方式同上.

条件语句(if/case)

if 为真的条件是命令的退出状态码为0

if [ -d /etc/passwd ]; then # 等价if test condition; then, 即使用test命令
# 注意方括号前后都要留有空格. 如果then放在下一行, 则不用加;, 但放在同一行节省空间
# condition不能测试命令退出状态码之外的条件, 常用判断如下
#   判断数值: -eq -ge -gt -le -lt -ne, 不能比较浮点数, 会报错
#   比较字符串: = != < > -n长度是否非0 -z长度是否为0, 注意 > <的转义问题
#   test比较文件:
#       -d是否存在并且是一个目录 -f是否存在并且是一个普通文件
#       -e是否存在 -s是否存在并且内容非空
#       -r/-w/-x是否存在且检查权限 -O/-G用户组相关
#       -nt/-ot更新或者更旧
    echo "/etc/passwd is plain file"
elif (( 20 > 5**2 )); then # 使用双括号来支持数学表达式
# 数学表达式: 除了上面test提供的数值比较操作外, 还支持++ -- ! ~ ** << >> & | && ||
    echo "20 < 25, the answer as plain as the nose on your face"
elif [[ "hello" = "h"* ]]; then # 使用双括号来支持字符串模式匹配
# 增加了一个新的字符串表达式: =~ 字符串表达式, 匹配扩展的正则表达式
# 字符串模式匹配: 字符串比较和上面test的比较方式一样, 只不过这里比价的对象可以是一个正则表达式
elif [ condition1 ] && [ condition2 ]; then
# 逻辑判断: [ condition1 ] && [ condition2 ] # &&与 ||或
    echo "here match successful"
else
    echo "..."
fi

case 模式匹配 (结尾;;&语法, 继续测试? 同时满足, 执行多个动作)

# 格式:
case var in
    pattern1 ) commands1 ;; # 若pattern1匹配, 则case匹配完成退出
    pattern2 ) commands2 ;;& # 若pattern2匹配, case执行动作后向下继续匹配
    # 注意case结尾使用 ;; 和 ;;& 的差异, 后者类似于C语言case没有使用break的情况.
    pattern3 | pattern4 ) commands3 ;;
    * ) default commands ;;
esac

循环语句(for/while/until)

# shell下的for循环
for item in list; do # 如果do放在下一行, 则不用加这个;
    # list可从 $var, $(..), **目录**(/home/*)获取
    # **list通过内部字段分隔符(环境变量IFS, internal field separator)划分**, IFS默认为空格/制表符/换行符
    # 修改IFSIFS=$'\n', 同时指定多个IFSIFS=$'\n':
done

# C语言风格的for循环:
for (( i = 1 ; i < 10 ; ++ i )); do
    ...
done

while 测试命令测试的是退出状态码为0
until和while命令工作的方式完全相反
break/continue

while test condition; do
    ...
    continue # continue 可带一个参数, 为要继续的循环层级, 默认为1
done

until test condition; do
    ...
    break # break可带一个参数, 为要跳出的循环层级, 默认为1
done

# while和until的**测试条件和if一致**, 对于continue和break, 和C语言一样, 不过它支持参数, 能够一次性跳出多个循环层级. 用的比较少, 还没有写脚本复杂到这种程度.

done 可以重定向循环中的输出

for (( i = 1; i <= 10; i++ )); do
    echo "$i"
done > output.txt # done命令重定向输出到output.txt而不是标准输出

while IFS=',' read -r name; do
    # 使用IFS分隔符, read命令会自动读取文本文件的下一行内容
    # 当read命令返回FALSE时,文件处理完成, while命令就会退出
    useradd "$name"
done < "user.csv" # done命令重定向输入, 把数据从文件中送入while命令

函数

function 定义函数

function get_name
{
    # 同命令行参数一样, 使用$1 $2来获取参数
    ...

    echo "?" # 通过echo命令来返回值
    return 0 # 使用return命令退出函数并返回特定的退出状态码
}
# 运行结束时会返回一个退出状态码, 用标准变量$?来确定函数的退出状态码
# 调用函数并获取返回值: name=$(get_name)
# !并非最后一条echo才是输出, 所有的echo都会当做返回值输出

引用脚本

source other.sh # 等价于. other.sh, 但用source更直观一些

通过source命令引用脚本文件, 类似于C语言中的include.
source命令会在当前shell上下文中执行脚本内容, 不会创建一个新shell.
退出状态码

exit 0或者在函数中return 0
exit退出脚本和return函数返回时, 可指定一个退出状态码. 退出状态码要立即获取使用, 任意的操作都会改变退出状态码.
$?保存了已执行命令的退出状态码(0-255), 命令执行成功返回0, 否则大于0(一般设置为1).
交互

read name # 等待输入并保存在name变量
read命令从标准输入或另一个文件描述符中接受输入, 将输入的数据赋给变量.
(一些常用的选项 -p:添加输入提示 -t:设置等待输入超时 -s:隐藏输入)
如果不指定接收变量, read命令会将它收到的任何数据都放进特殊环境变量REPLY中.
重定向

输出(将命令的输出保存到指定文件), 输入(将文件内容重定向到命令)

echo "hello world" > data.txt
输出覆盖数据
echo "hello world" >> data.txt
输出追加数据
wc < data.txt # 分别输出了文件的行数词数字节数
输入文件数据
wc << EOF(换行等待输入直到遇到下一个EOF为止)EOF
手动输入数据, 需要指定一个文本标记划分输入数据的开始和结尾)
(无需使用文件进行重定向, 只需要在命令行中指定用于输入重定向的数据就可以)
管道

echo "hello world" | more
将一个命令的输出作为另一个命令的输入
标准输入输出

默认情况下, Linux会将STDERR导向STDOUT

echo "This is an error message" > &2 # 临时重定向输出到标准错误
临时重定向, 在重定向到文件描述符时, 必须在文件描述符数字之前加一个&
exec 1>testout
永久重定向, 创建输出文件描述符: 用exec命令来给输出分配文件描述符, 除了0 1 2, 还可以自定义6个
exec 3>&1 \ exec 1>test14out \ exec 1>&3
重定向文件描述符
exec 3>&-
关闭文件描述符