解决Unix-like、Windows系统之间文本换行符不同的问题

参考博客 :point_right: 网址

简介

\r是回车符,\n是换行符,各个系统的换行标志:

win 用 \r\n
linux/unix 用 \n
Mac OS 用 \r

CR用符号’\r’表示, 十进制ASCII代码是13, 十六进制代码为OxOD
LF使用’\n’符号表示, ASCII代码是10, 十六制为0x0A
所以:
Windows下用的是OAOD,即CR&LF,
linux/unix用的是OA,即LF
MacOS用的是OD,即CR

CRLF来历

计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。

后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。Unix 系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<回车><换行>”,即“ \r\n”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

常见问题

问题一:文本类型文件互转

包括 txt sh等文件

方法一
使用notepad++中的格式转换功能,见图

方法二
针对sh文件,可以使用vim工具
在vim模式下,输入set ff发现文件类型为format=dos
在vim模式下,可以使用set ff=unix改变format为unix

问题二:doc文档乱码

Windows下编写的doc文档,在Linux下查看(用Open Office)一般都会乱码

  • 解决方法:先用Open Office打开,然后再全选,把字体设置为SYSong18030,OK中文简体和繁体都显示正常了。

问题三:FTP传文件时乱码

在不同平台间使用FTP软件传送文件时, 在ascii文本模式传输模式下, 一些FTP客户端程序会自动对换行格式进行转换,经过这种传输的文件字节数可能会发生变化”)问题四:在不同平台间使用FTP软件传送文件时, 在ascii文本模式传输模式下, 一些FTP客户端程序会自动对换行格式进行转换,经过这种传输的文件字节数可能会发生变化

  • 解决方法:如果你不想ftp修改原文件, 可以使用bin模式(二进制模式)传输文本。