Bash 中的正则表达式匹配

Fumbani Banda 2023年1月30日
  1. Bash 中的重新匹配运算符
  2. 在 Bash 中匹配数字
  3. 正则表达式匹配 Bash 中字符串的开头
  4. 正则表达式匹配 Bash 中字符串的结尾
  5. Bash 中的正则表达式匹配电子邮件
Bash 中的正则表达式匹配

本教程演示了使用 bash 中的重新匹配运算符进行正则表达式匹配。

Bash 中的重新匹配运算符

=~ 运算符称为重新匹配运算符。它使用以下语法。

[[ string =~ regex ]]

重新匹配运算符对其从左到右的字符串执行正则表达式匹配。如果左侧与右侧匹配,则运算符返回 0,否则返回 1

在 Bash 中匹配数字

下面的脚本检查变量 $greet 是否包含右侧提到的字符,在我们的例子中是数字。如果存在完全匹配,则重新匹配运算符返回 0,并且脚本会打印出正确的输出。

greet="Hello,World!"

if [[ $greet =~ [0-9] ]]; then
    printf "$greet is a number\n"
else
    printf "$greet is not a number\n"
fi

由于 $greet 变量的值只有数字以外的字符,因此重新匹配运算符返回 1 并打印以下输出。

Hello,World! is not a number

在这里,我们在脚本中创建了一个新变量,该变量只有名为 num 的数字。然后我们检查 num 变量是否只有数字,并根据重新匹配运算符返回的值打印相应的输出。

#!/bin/env bash

num="2021"


if [[ $num =~ [0-9] ]]; then
    printf "$num is a number\n"
else
    printf "$num is not a number\n"
fi

由于变量 num 只有数字,重新匹配运算符返回 0,脚本打印下面的语句。

2021 is a number

正则表达式匹配 Bash 中字符串的开头

下面的脚本检查 $greet 变量中的值是否以数字开头。^ 用于指定匹配字符串开头的字符。根据运算符返回的值,我们打印相应的输出。

#!/bin/env bash

greet="123Hello,World!"


if [[ $greet =~ ^[0-9] ]]; then
    printf "$greet starts with a digit(s).\n"
else
    printf "$greet does not start with a digit(s)\n"
fi

由于 $greet 变量中的值以数字开头,因此运算符返回 0,并在下面打印输出。

123Hello,World! starts with a digit(s).

让我们将 $greet 设置为一个新值,如下所示并运行脚本。

#!/bin/env bash

greet="Hello,World!123"

if [[ $greet =~ ^[0-9] ]]; then
    printf "$greet starts with a digit(s).\n"
else
    printf "$greet does not start with a digit(s)\n"
fi

bash 运算符将返回 1,因为变量 $greet 中的字符串不以数字开头。该脚本将打印如下所示的输出。

Hello,World!123 does not start with a digit(s)

正则表达式匹配 Bash 中字符串的结尾

下面的脚本检查 $greet 变量中的值是否以数字结尾。$ 用于指定匹配字符串末尾的字符。

要打印的输出将取决于重新匹配运算符返回的值。

#!/bin/env bash

greet="Hello,World!123"


if [[ $greet =~ [0-9]$ ]]; then
    printf "$greet ends with a digit(s).\n"
else
    printf "$greet does not end with a digit(s)\n"
fi

$greet 变量中的字符串值以数字结尾。重新匹配运算符返回 0,脚本会在下面打印输出。

Hello,World!123 ends with a digit(s).

让我们更改 $greet 变量的值,如下面的脚本所示。

#!/bin/env bash

greet="123Hello,World!"

if [[ $greet =~ [0-9]$ ]]; then
    printf "$greet ends with a digit(s).\n"
else
    printf "$greet does not end with a digit(s)\n"
fi

由于变量 $greet 中的字符串不以一个或多个数字结尾,重新匹配运算符返回 1,并且脚本会在下面打印输出。

123Hello,World! does not end with a digit(s)

Bash 中的正则表达式匹配电子邮件

要匹配电子邮件,这个 ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$ 通常使用正则表达式模式。

#!/bin/env bash

email="example@delftstack.com"


if [[ $email =~ ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$ ]]; then
    printf "$email is a valid email.\n"
else
    printf "$email is not a valid email.\n"
fi

下面的输出显示了一封已检查并已通过检查的电子邮件。

example@delftstack.com is a valid email.

让我们删除电子邮件末尾的 .com,如下所示并运行脚本。

#!/bin/env bash

email="example@delftstack"


if [[ $email =~ ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,4}$ ]]; then
    printf "$email is a valid email.\n"
else
    printf "$email is not a valid email.\n"
fi

电子邮件未通过测试,因为它没有最后一部分 .com

example@delftstack is not a valid email.
作者: Fumbani Banda
Fumbani Banda avatar Fumbani Banda avatar

Fumbani is a tech enthusiast. He enjoys writing on Linux and Python as well as contributing to open-source projects.

LinkedIn GitHub