linux下打开txt中文文档为什么会乱码? | 您所在的位置:网站首页 › linux打开word文档乱码 › linux下打开txt中文文档为什么会乱码? |
可能有以下几个原因: 安装Linux的时候没有安装中文字库。 txt编码格式是utf-8或者其他格式,但是打开该文档的编辑器默认编码格式不是同一种,如使用了ASCII码。 该文档已经被加密。 该文档已经被损坏。 Linux文件名、文件内容乱码,主要原因是windows上的中文编码默认是GBK,而Linux默认中文编码为UTF-8,由于编码不一致,所以导致乱码问题。为了解决这个乱码,需要对文件进行转码,具体如下:1、前提保证已安装了convmv;2、具体convmv的用法:Convmv –f 源编码 –t 新编码 [选项] 文件名一般常用参数:-r 递归处理子目录--notest 真正进行操作,默认情况下是不对文件进行真实操作的,只是一个预览--list 显示所有支持的编码--unescap 可以做一个转义3、比如我们有一个utf8的文件名,要求转换成gbk编码,命令如下:Convmv –f utf-8 –t gbk –notest 文件名也可以使用linux下最好用的编码转换工具iconv来进行转码操作。例子:将GBK编码的文件转换成UTF-8iconv -f GBK -t UTF-8 gbkfile.txt utf8file.txt出现这种情况的原因为两种操作系统的中文压缩方式不同,在windows环境中中文压缩一般为gbk,而在linux环境中为utf8,这就导致了在windows下能正常显示txt文件在linux环境下打开呈现了乱码状态。 解决方法:在linux用iconv命令,输入命令如下 iconv -f gbk -t utf8 file.pdf file.pdf.utf8 此时会重生一file.utf8文件,打开之后就能正常显示中文 linux系统下修改语言配置方法有: 法一:修改/etc/profile文件,增加export LANG=zh_CN.GB18030 法二:修改/etc/sysconfig/i18n文件,将 #LANG="en_US.UTF-8" #SUPPORTED="en_US.UTF-8:en_US:en" #SYSFONT="latarcyrheb-sun16" 改为 LANG="zh_CN.UTF-8" SUPPORTED="zh_CN:zh:en_US.UTF-8:en_US:en:zh_CN.GB18030" SYSFONT="latarcyrheb-sun16" /etc/profile: 为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行. /etc/sysconfig/i18n 这里存放的是系统的区域语言设置 LANG 表明你当前系统的语言环境变量设置 ,这里是 zh_CN.GB18030 SUPPORTED 表明系统预置了那些语言支持 ,不在项目中的语言不能正常显示 SYSFONT 定义控制台终端字体,你文本登录的时候显示的字体是 latarcyrheb-sun16 I18N 是 internationalization 的缩写形式,意即在 i 和 n 之间有 18 个字母,本意是指软件的“国际化”.I18N支持多种语言,不过同一时间只能是英文和一种选定的语言,例如英文+中文、英文+德文、英文+韩文等等; 如果在SCRT上操作时中文乱码,可依次点击options--session options--appearance,选择character encoding为UTF-8 欢迎分享,转载请注明来源:内存溢出 原文地址:https://outofmemory.cn/yw/8645601.html |
CopyRight 2018-2019 实验室设备网 版权所有 |