linux怎样查询文本文件内的特定文字内容

日期：2026-01-28 05:17:15 作者：创始人浏览：0

利用shell脚本如何提取一个文件中某一特定行和下面若干行的内容

嘿，咱们来聊聊Linux下的文本处理技巧。
首先，在/root目录下创建一个txt文件，里面放点数据，用竖线分隔开，这将是我们的实验样本。
接着，用sed命令来玩点花样，比如显示第1 8 行数据，就用sed -n '1 8 p' data.txt。
如果你想显示从第1 0行到第1 8 行的内容，命令就是sed -n '1 0,1 8 p' data.txt。

再来聊聊head和tail。
tail这货，大家最熟悉的就是看文件末尾了，比如tail -n 3 data.txt就能看最后三行。
反过来，tail -n +3 data.txt则是从第三行看到最后一行。
head则相反，用来显示开头几行，比如head -n 1 0 data.txt就是显示前1 0行。

两者结合用，比如想看倒数第二行，就用tail -n 2 data.txt | head -n 1
最后，awk是个文本处理的大神，配合脚本可以打印特定行和列。
比如，打印第1 8 行，就用awk 'NR==1 8 {print}' data.txt，NR就是行号的意思。
这招在处理大量数据时特别有用哦！

linux如何查看文本最后500个字？

输入"tail -n 5 00 aaa.txt"这行指令，其实就是在看aaa.txt这个文件最后5 00个字，挺实用的吧。
那咱们再聊聊Linux这个系统。
说起来，Linux内核这东西，最早是芬兰小子李纳斯·托瓦兹在赫尔辛基大学读书那会儿，纯粹是个人兴趣捣鼓出来的。
Linux本身呢，是个免费又开源的类Unix操作系统，支持多用户、多任务，还能同时跑多个线程和利用多核CPU。
而且它兼容大部分UNIX的工具软件、应用还有网络协议，不管你是3 2 位还是6 4 位的硬件，它都能支持。
Linux还继承了Unix那种以网络为中心的设计思路，所以它作为多用户网络操作系统，性能特别稳。

Linux cut命令

Linux下的cut命令其实是个挺实用的工具，主要用于从文本中按照指定的位置来提取文字。
下面就来详细说说这个命令：
基本用法是这样的：cut [选项] [文件]。
这里的选项就是用来告诉cut命令怎么切割文本的，而文件当然就是要处理的文本文件啦。
要是你没指定文件，cut命令会从标准输入那里读数据。

常用的选项有几个：

b：按字节位置来切割文本。
比如说cut -b 3 ，就会提取每行的第3 个字节。

c：按字符位置来切割，跟b用法类似，不过这是基于字符而不是字节。

d：这个选项用来指定字段分隔符。
默认情况下，分隔符是制表符，但你可以把它改成别的字符，比如逗号、空格之类的。

f：按字段位置来切割文本。
比如说cut -d ':' -f 1 /etc/passwd，就会从/etc/passwd文件中提取以冒号为分隔符的第一字段，通常这个字段是用户名。

举个例子：

如果你想提取每行的第3 个字节，可以这么做：echo "abcdefg" | cut -b 3 ，结果会输出c。

想提取某个文件里以冒号为分隔符的第一字段，比如/etc/passwd，就使用cut -d ':' -f 1 /etc/passwd，这样就会输出每行的第一字段，也就是用户名。

总的来说，cut命令在数据处理和分析中很有用。
你可以用它从日志文件、配置文件这些文本中提取特定的信息，再配合其他的命令，就能做复杂的数据分析了。
用好了cut命令，处理和分析数据会变得非常高效，也能省不少事儿。

linux中grep命令的使用

嘿，Linux迷们，今天来聊聊grep命令，这可是个文本搜索的大神器呢！它就像你的私人侦探，能通过正则表达式在文本里找到线索，然后把那些匹配的行打印给你看。
别看它名字叫grep，但它可是个全能型的Global Regular Expression Print，意思就是它能全局搜索正则表达式，而且这宝贝对所有用户都是开放的哦！
用起来也简单，格式就是grep [options]，接下来咱们聊聊它的主要参数。

-c 只显示匹配的行数，不打印具体内容。

-I 这个选项很酷，它能让搜索变得不拘小节，不区分大小写，但只针对单个字符哦。

-h 当你在多个文件里搜索时，用这个选项可以让grep低调点，别把文件名也打印出来。

-l 这个选项正好相反，它只显示包含匹配字符的文件名。

-n 这个选项会给你详细信息，显示匹配行及其行号。

-s 想要grep在找不到匹配内容或文件不存在时别烦你，用这个选项就对了。

-v 想要看看哪些行不包含匹配文本？这个选项就是你的救星。

正则表达式的参数也很丰富，比如\可以忽略特殊字符，^和$分别匹配行首和行尾，\<和\>可以定位到行的某个位置，[]和[-]可以匹配特定的字符或字符范围，.代表任意字符，则表示前面的字符可以出现0次或多次。

最后，让我们来几个小例子感受一下grep的强大：

$ grep 'test' d 会找所有以d开头的文件中包含test的行。

$ grep 'test' aabbcc 会查看aa、bb、cc文件中是否有匹配test的行。

$ grep '[a-z]\{5 \}' aa 会找出包含至少5 个连续小写字符的字符串。

怎么样，是不是觉得grep就是一个文本搜索的超级英雄呢？快来试试吧！

linux命令uniq

Hey, Linux迷们！今天来聊聊一个超实用的命令——uniq。
这货能帮你从文件里筛除那些讨厌的重复行。
用法有点儿复杂，但别急，我来一步步解析。

首先，uniq的基本用法是这样的：uniq [-c|-d|-u][-fFields][-sCharacters][-Fields][+Characters][InFile[OutFile]]。
这个命令会读取你指定的文件或者标准输入，然后对比相邻的行，把重复的都给踢掉。

记住，使用uniq之前，最好先用sort命令把文件内容排序，这样重复行才会挨着，uniq才能干得漂亮。

默认情况下，uniq会处理所有行。
但如果你想忽略某些字段或者字符，可以用-f和-s选项。
这些选项后面跟着的是你想要忽略的字段数或字符数。
不过要注意，这些数字得是正的十进制整数。

uniq有几个标志可以用来控制输出：
-c：在输出行前加上该行出现的次数。

-d：只显示重复行。

-u：只显示不重复的行。

如果你想忽略特定的字段或字符，可以用-f和-s选项。
比如，uniq -f 1 会忽略第一字段，uniq -s 2 会从第二字符开始比较。

还有 -n 和 +n 选项，用来忽略前n个字段或前n个字符。

运行uniq后，它会返回一个退出状态。
如果一切顺利，那就是0；如果出了错，就大于0。

举个例子，如果你想删除fruit文件中的重复行，保存到newfruit，可以这样操作：uniq fruit > newfruit。
假设fruit里有重复行，处理后newfruit里就只会剩下一个apples，一个peaches，以此类推。

最后，如果你想知道uniq-c的用法，比如这样：harley casely wedley harley linda，你可以先使用cut -c1 -8 | sort | uniq -c > result.txt，这样就能看到每个名字出现的次数了。

希望这能帮到你，下次用到uniq时，记得这些小技巧哦！

标签： shell脚本文本处理