使用带有正则表达式的 sed 查找和替换复杂字符串
处理文本文件时,你经常需要识别和替换一个或多个文件中的文本字符串。
sed 是一个流编辑器。它可以对文件和输入流(如管道)执行基本的文本操作。你可以使用 sed 搜索、查找和替换单词和行,以及插入和删除它们。
支持基本和扩展的 regex,允许你匹配复杂的模式。在这篇文章中,我们将了解如何使用 sed 查找和替换字符串。我们还将演示如何使用递归搜索和替换。
在 Bash 中使用 sed 查找和替换字符串
sed 有多种版本,每个版本都有其特点。
Linux 发行版默认预装了 GNU sed,但 Mac OS 使用 BSD 版本。我们将使用 GNU 版本。
该语法用于使用 sed 搜索和替换文本:
sed -e 's/Search_Regex/substitution/g' Filename
在上面使用的语法中,定义如下:
-e是默认写入标准输出的 sed 输出。该参数指示sed在当前位置编辑文件。如果定义了扩展名,则会生成替换文件。///是用作分隔符的字符。尽管大多数人使用斜线 (/) 字符,但它可以是任何字符。Search_Regex是一个搜索的东西。我们将使用regex或常规字符串。substitution用作要替换的字符串。g是全局替换的标志。sed默认逐行读取文件,并且仅更改每行中第一次出现的Search_Regex。当设置替换标志时,所有实例都会被替换。Filename是应该运行命令的文件名。
让我们看一下使用 sed 命令搜索和替换文件中的文本的常用参数和标志。我们将使用我们为演示目的创建的示例文件,即 live.txt。
live.txt
Omicron is the endgame of Covid and Omicron 9876
如果 g 标志被忽略,则仅替换每行中搜索字符串的第一个实例。
$ sed -e 's/endgame/infinitywar/' live.txt
输出:
Omicron is the infinitywar of Covid and Omicron 9876
sed 用全局替换标志替换所有出现的搜索模式:
$ sed -e 's/Omicron/thanos/g' live.txt
输出:
thanos is the endgame of Covid and thanos 9876
正如你可能已经观察到的,字符串 Omicron 已被替换为 thanos。
在 Bash 中的字符串中查找和替换分隔符 /
如果要发现和替换包含分隔符/ 的字符串,你必须使用反斜杠\ 来转义斜杠。例如,要将 /bin/bash 替换为 /usr/bin/zsh,请使用以下命令:
$ sed -e 's/\/bin\/bash/\/usr\/bin\/zsh/g' live.txt
输出:
Omicron is the endgame of Covid and Omicron 9876
让我们使用竖线|让我们更容易理解或冒号:,尽管任何其他字符就足够了。
$ sed -e 's|/bin/bash|/usr/bin/zsh|g' live.txt
输出:
Omicron is the endgame of Covid and Omicron 9876
如你所见,结果与前一个相同。
查找所有数字并用 Bash 中的字符串数字替换它们
正则表达式还可以找到所有四个数字并将它们替换为字符串数字。例如:
$ sed -e 's/\b[0-9]\{4\}\b/number/g' live.txt
输出:
Omicron is the endgame of Covid, and Omicron number
如你所见,9876 被 number 字符串替换。
最后但同样重要的是,每当你使用 sed 编辑文件时,你应该始终进行备份。给 -i 选项一个备份文件的扩展名来完成这个。
例如,编辑 live.txt 并将原始文件保存为 live.txt。如果你要使用 bak,你可以通过以下方式做到这一点:
$ sed -i.bak 's/Omicron/thanos/g' live.txt
使用 ls 命令列出文件以确保已创建备份:
$ ls
输出:
live.txt
live.txt.bak
虽然一开始可能看起来很复杂,但使用 sed 查找和更改文件中的文本相对简单。