如何在 Linux 中将文件编码转换为 UTF-8

这些是 iconv 变换编码的参数。
-f 原始编码。
-t 目标编码。
-o 输出文件名。
如果不指定-o,则默认覆盖原文件。

我上周刚刚处理了 gb2 3 1 2 到 utf8 的转换。
命令是 iconv -fgb2 3 1 2 -tutf8 file.txt -o newfile.txt。

或者,您可以使用 gedit。
打开文件,另存为,选择编码utf8 并保存。

但是,您需要安装 gedit。
命令行更加通用。

你觉得怎么样?

linux下查看文件编码及修改编码

说白了,Linux下查看和修改文件非常简单,但细节却非常关键。
首先,我们来谈谈最重要的事情。
要查看录制的文件,Vim工具是一个好帮手。
直接命令setfileencoding即可显示文件编码。
还有一点,如果 Vim 显示插值字符,可以在 .vimrc 文件中设置 setencoding=utf-8 和 fileencodings=ucs-bom,utf-8 ,cp9 3 6 ,这样 Vim 就会自动尝试识别这些格式。

一开始我以为我只能看到Vim的描述,但后来我发现我错了。
您可以使用 sudo yum -yenca -yenca 安装 enca 命令。
使用电子邮件enca检查编码文件,如名称:Universal Transformation Formats 8 bit;UTF-8 CRLFlinetermerated,但要注意enca可能无法有效识别GBK。

等等,还有一件事,如果你想将文件转换为 Vim,只需使用 setfileencoding=utf-8 即可。
或者使用enconv命令进行转换,例如将GBK编码的文件转换为UTF-8 ,命令为filename enconv -Lzh_CN -xUTF-8 对于更复杂的转换, iconv 命令更有用。
命令的格式为 iconv -fencoding -tencoding 输入文件。
例如,要将文件转换为 GBK utf-8 ,步骤为 iconv -fUTF-8 -tGBK file1 -o file2 很多人不注意这一点。
请记住在使用这些命令之前检查文件描述以避免转换错误。
我认为这些方法值得尝试,但是在使用enca时,要注意GBK可能无法达到最好的描述。

linux下怎么改变文件的编码格式

当我在 Linux 系统中遇到文件编码问题时,这确实很常见。
我记得曾经有一个文件,打开时充满了被截断的字符。
当时我使用的是Vim编辑器,输入命令“:setfileencoding”。
结果发现是UTF-8 编码的文件,但是打开后显示为截断字符。

我当时没有多想,只是想怎么解决。
后来查了资料,发现可以通过编辑Vim配置文件~/.vimrc来设置默认的编码格式。
我按照互联网上的说法,将这些代码行添加到 ~/.vimrc 文件中:“set encoding=utf-8 ”和“fileencodings=ucs-bom,utf-8 ,cp9 3 6 ”。
这样,Vim 可以自动识别文件编码,当您再次打开文件时,代码被截断的问题将得到解决。

但是,转换文件编码有时是一件令人头疼的事情。
那时我会使用 iconv 工具,它功能强大,而且使用起来也不复杂。
例如,如果有一个GBK编码的文件,我想将其转换为UTF-8 ,我输入命令“iconv -fGBK -tUTF-8 file1 -o file2 ”。
该命令中,“-fGBK”指定输入文件的编码格式,“-tUTF-8 ”指定输出文件的编码格式,“-o file2 ”指定输出文件的保存路径。

当然,除了命令行工具之外,Windows系统自带的记事本也很有用。
打开文件后,从“文件”菜单中选择“另存为”,然后选择适当的编码格式进行保存。
这种方法简单直观,对于不熟悉命令行的用户来说是一个不错的选择。

归根结底,文件编码问题要根据实际情况来处理。
有时不同的编码会导致文件内容显示异常,所以掌握这些方法是非常有用的。
我记得有一次,一位客户因为他的文件无法在其他系统上打开而感到焦虑。
我用这些方法帮助他们解决了问题,客户非常满意。