- 作者帖子
zyz游客之前存的好好的TXT文本,也用过,都没问题,近期再用突然发现都变成乱码了,这个是怎么回事,如何解决呢?
炁游客切换一下字体、字符脚本或者用写字板、word、wps打开试试,都不行可能就是文件损坏,需要重新下载源文件
lee游客设置,区域 设置,更改系统区域设置为:中文(简体,中国)
zyz游客@lee #147610
请教这个设置在哪里?
zyz游客@炁 #147609
切换字体、用写字板打开还都是乱码。为啥会损坏呢?
三少游客是txt文件的解码问题。你这txt可能是很旧的版本,现在多用unicode来打开。你试用Word来打开,但要先打开word,再选打开再选文件。这时应会问你想选用的解码。你可以试不同的解码看。
层身游客记事本 -> 文件 -> 另存为,最底下编码选择utf-8或其他编码试试
炁游客损坏的原因很多,磁盘问题、系统问题……
①复制粘贴到别处,改个文件名,再打开,自动重新识别字符编码试试
②拖放到浏览器打开试试
③在线检测修复或者转换编码试试
never.tools/zh-cn...-encoding/
abctool.gitlab.io/encod...html?_lang
@zyz #1476
小透明游客在记事本中的 "ANSI" 并不指特定的编码标准,而是根据系统区域设置来选择的编码。对于中文系统,这个编码通常是 GBK(GB2312 的扩展版)。在英文系统中,"ANSI" 通常指的是 Windows-1252。
GB2312 是中国地区的标准编码(1980 年发布,共收录 6763 个汉字),但后来被 GBK 扩展(GBK 共收录了 21886 个汉字和图形符号)。
windows设置---时间和日期--区域,可以设置ansi 偏好的地区(下面的设置是 日期时间格式偏好,不影响软件)。
GBK 兼容 GB2312,在 Windows 上,通常看到的 ANSI 实际上是 GBK 而不是 GB2312。
还有 GB18030 发布于2000年,收录了70244 个汉字。
一般来说,utf8 一个汉字是三个字节(byte),gb2312 是两个字节表示,(例如“书格”二字,utf8是\xe4\xb9\xa6,\xe6\xa0\xbc; 而gb2312 是\xca\xe9,\xb8\xf1) 可以节约空间。
在文件底层,是只有字节而没有文字,同样的字节\xe4\xb9\xa6,\xe6\xa0\xbc 用utf8 解释为“书格”,也可以\xe4\xb9,\xa6\xe6,\xa0\xbc 用gb2312 就解释为“涔”,(仅仅前两个字节能查到,后面冇对应的字符)。
如果看到乱码的文件,首先确保乱码的文件的底层字节是对的,只是显示的编码对应错误,这样是可以挽救的。要是错误的显示编码,再经过不同编码间的转换,就会丢失有意义的字节码顺序,有可能就再也找不回来了。就好比大家互相口头传递话,到最后会变得非常离谱,因此重要的指令,安排,都是需要依托书面文件的。
- 作者帖子
正在查看 9 个帖子:1-9 (共 9 个帖子)
正在查看 9 个帖子:1-9 (共 9 个帖子)
正在查看 9 个帖子:1-9 (共 9 个帖子)