Linux命令取某一列的方法linux取列

记得有一次,下午的课上,我看到一位同事在电脑上使用剪切命令来处理一个从Excel导出的文本文件。
他想要提取在以下分析中识别的用户 ID 和名称列。
他告诉我使用 cut 命令非常简单。
只需要输入精度行-f1 ,2 filename.txt,然后回车输入,电脑就会自动弹出包含指定列的数据。

当时我突然想到,如果文件中的数据用逗号分隔的话,是不是可以用类来运行呢?于是我尝试了 awk -F, '{print $1 ,$2 }' filename.txt,结果同样顺利。

后来的调试脚本以及指示和错误信息必须从文件中提取。
当时我使用了but命令,输入了but -n 's/^.,([^,]).$/\1 /p' log.txt。
嘿嘿,这个命令也起作用了。

回想起来,这三个命令各有各的用途,但它们都是文本处理的强大工具。
但我还是很好奇,如果你有非常大的数据,你想用什么系统来提取火车?

如何使用Linux strings提取文本

使用终端中的行直接读取文件中的单词。

添加 -n 数字以查找长单词。

使用 > 生成并保存文件。

添加 -grep 来搜索特定单词。

使用 -wc-l 表示数字。

使用 -sort-u 重复。

路径错误,无法读取文件。
使用须藤。

非 ASCII 字符;输入代码。

示例:ls 输出存储在 ls_strings.txt 中;长字符大于8 ,则统计总数。

Linux cut命令怎么使用

嗯,cut 命令确实非常有用。
我在处理日志文件时经常使用它。
但如果使用不当,很容易出错,尤其是分隔符和字段选择方面。
有时可能需要很长时间才能做好。
您想知道具体如何使用吗?让我举一个小例子。

例如,如果要从文件的第二列中提取数据,并且该数据列的分隔符是制表符(Tab),则必须使用 -f2 -d' ' 选项。
我用它来监控 CSV 文件的服务器性能。
该文件中的每一列均由制表符分隔。
如果您想获取 CPU 使用率列(通常是第二列),请执行以下操作:Cut -d'' -f2 哦,马上就出来了。
但是,如果您的分隔符不是 Tab,则需要先更改 -d 选项。
否则,你肯定会感到困惑。

还有另一个陷阱。
处理汉字或特殊符号时就是这种情况。
例如,我之前有一个中英文混合的文件。
我直接使用-b来提取字节。
结果,汉字被切断,显示不完整。
后来,我添加了 -n 选项来完成它,并删除了 -b1 -2 -n 以正确处理它。
一起使用 -n 和 -b 非常重要。

我尝试了你提到的所有选项。
-c 字符提取通常用于需要精确检索特定字符的场景,例如提取IP地址的最后一位数字。
请注意,-f 最常用于提取字段,但字段之间可能包含空格。
在某些情况下,您可能需要使用 awk 或使用常规预处理。
否则,Cut 本身在处理空格分隔符时很容易出现问题。
之前我正在处理会议录音文件。
姓名和日期之间有一个空格。
使用 Cut -f2 直接将名称与日期关联起来。
我不得不使用 Cut -d' ' -f2 来代替。

组合使用时,cut 和 grep 常常一起使用。
例如,如果要在日志中搜索错误消息并提取单个错误代码,请首先使用 grep 过滤行,然后使用 Cut 提取字段。
像这样: grep 'ERROR' log.txt |剪切 -d' ' -f9 ,假设错误代码始终位于每行的第 9 个字段中。
我已经多次使用这个过程并且非常有效。

总之,cut命令看似简单,但实际操作中需要考虑分隔符、字段顺序等细节。
请告诉我您特别想使用哪个选项或者您遇到什么问题。
我会帮助你。

Linux cut 命令详解

cut 命令直接提取文本内容。

-f 选项由默认分隔符 Tab 分隔。

-d 选项自定义边框,例如两个点。

-b选项提取字节,如-b1 ,3
-c选项按字符提取,如-c1 -3
--complement 返回选定的字段,例如-f1 ,6 --complement。

--output-delimiter 更改输出分隔符,例如空格。

/etc/passwd 文件以冒号分隔。

提取 /bin/bash 行的字段 1 和 6 ,以冒号分隔。

-f1 ,6 显示字段 1 到 6
-f1 显示第一个字段。

-f--补码显示除字段2 之外的所有字段。

-c 按字符位置输出,如-c1
-c1 -7 显示字符 1 到 7
-b 按字节位置提取,例如 -b1 ,2 ,3
-b1 -3 显示字节 1 到 3
ps 命令输出 USER PID COMMAND。

提取可用内存值并将其保存到文件中。

剪切命令经常与其他命令结合使用。

斜杠不支持多个空格边界。

使用 tr 将多个空格预处理为单个空格。