4.2 文件

文件是指在各种存储介质上永久存储的数据集合,如Word以.doc形式存在,将其保存在磁盘上就是磁盘文件,输出到打印机上就是打印文件。

Python可以从文件输入数据到程序中,也可以将程序的结果输出到文件。根据文件的存储形式,文件分为文本文件(ASCII文件)、二进制文件。其中,图形文件及文字处理程序等计算机程序都属于二进制文件,含有特殊的格式及计算机代码。文本文件(ASCII文件)则是可以用任何文字处理程序阅读的简单文本文件。

4.2.1 ASCII文件

ASCII文件又称为文本文件,是由ASCII编码字符所组成并且不带任何格式的文件,通常使用字处理软件(如Windows的记事本等)编辑。文本文件的读取必须从文件的头部开始,一次全部读出,不能只读取中间的一部分数据,不可以跳跃式访问。文本文件的每一行文本相当于一条记录,每条记录可长可短,记录之间使用“换行符”进行分隔,不能同时进行读、写操作。文本文件的优点是使用方便,占用内存资源较少,但其访问速度较慢,并且不易维护。

4.2.2 二进制文件

二进制文件作为最原始的文件类型,以字节为单位访问数据,二进制文件的存储与加载速度较快。二进制文件不适合阅读,不能用文字处理软件进行编辑。

使用二进制文件有如下三个好处:

1)比较节约空间,这两者存储字符型数据时并没有差别。但是在存储数字,特别是实型数字时,二进制更节省空间,比如存储3.1415927,文本文件需要9个字节,分别存储:3.1415927这9个ASCII值,而二进制文件只需要4个字节。

2)内存中参加计算的数据都是用二进制存储的。如果存储为文本文件,则需要一个转换过程,当数据量较大时,就会有明显的速度差别。

3)对于比较精确的数据,使用二进制存储数据不会造成有效位的丢失。