文件概述
所谓“文件”是指一组相关数据的有序集合。这个数据集有一个名称,叫做文件名。实际上在前面的各章中我们已经多次使用了文件,例如源程序文件、目标文件、可执行文件、库文件 (头文件)等。
文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中来。从不同的角度可对文件作不同的分类。从用户的角度看,文件可分为普通文件和设备文件两种。
普通文件是指驻留在磁盘或其它外部介质上的一个有序数据集,可以是源文件、目标文件、可执行程序;也可以是一组待输入处理的原始数据,或者是一组输出的结果。
对于源文件、目标文件、可执行程序可以称作程序文件,对输入输出数据可称作数据文件。
设备文件是指与主机相联的各种外部设备,如显示器、打印机、键盘等。在操作系统中,把外部设备也看作是一个文件来进行管理,把它们的输入、输出等同于对磁盘文件的读和写。
通常把显示器定义为标准输出文件,一般情况下在屏幕上显示有关信息就是向标准输出文件输出。如前面经常使用的 printf, putchar 函数就是这类输出。
键盘通常被指定标准的输入文件,从键盘上输入就意味着从标准输入文件上输入数据。scanf,getchar 函数就属于这类输入。
文件类型
在处理文件时,您应该了解两种类型的文件:
- 文本文件;
- 二进制文件
1. 文本文件
文本文件是普通的 .txt 文件。您可以使用任何简单的文本编辑器(例如记事本)轻松创建文本文件。
当您打开这些文件时,您会以纯文本形式看到文件中的所有内容。您可以轻松地编辑或删除内容。
它们需要最少的维护工作,易于阅读,提供最低的安全性并占用更大的存储空间。
从文件编码的方式来看,文件可分为 ASCII 码文件。ASCII 文件也称为文本文件,这种文件在磁盘中存放时每个字符对应一个字节,用于存放对应的 ASCII 码。
2.二进制文件
二进制文件主要是计算机中的 .bin 文件。
它们不是以纯文本形式存储数据,而是以二进制形式(0 和 1)存储数据。
它们可以保存更多的数据,不易读取,并且比文本文件提供更好的安全性。
例如, 字符5678 的存储形式为:00110101 00110110 00110111 00111000
数字5和字符5的ASCII码是不一样的。
ASCII 码文件可在屏幕上按字符显示,例如源程序文件就是 ASCII 文件,用 DOS 命令 TYPE可显示文件的内容。由于是按字符显示,因此能读懂文件内容。
二进制文件是按二进制的编码方式来存放文件的。
例如, 数 5678 的存储形式为:
00010110 00101110
只占二个字节。二进制文件虽然也可在屏幕上显示,但其内容无法读懂。C 系统在处理这些文件时,并不区分类型,都看成是字符流,按字节进行处理。
为什么C语言编程需要文件?
- 当程序终止时,整个数据都会丢失。使用文件编程可以在程序终止时在文件中保留运行的数据;
- 如果您必须输入大量数据,则将它们全部输入将花费大量时间;但是,如果您有一个包含所有数据的文件,您可以使用 C 中的一些命令轻松访问该文件的内容;
- 您可以轻松地将数据从一台计算机移动到另一台计算机,而无需进行任何更改。
文件的打开与关闭
文件指针
在C语言中用一个指针变量指向一个文件,这个指针称为文件指针。通过文件指针就可对它所指的文件进行各种操作。
定义说明文件指针的一般形式为:
FILE *指针变量标识符;
其中 FILE 应为大写,它实际上是由系统定义的一个结构,该结构中含有文件名、文件状态和文件当前位置等信息。
在编写源程序时不必关心 FILE 结构的细节。
例如:
FILE *fp;
表示 fp 是指向 FILE 结构的指针变量,通过 fp 即可找存放某个文件信息的结构变量,然后按结构变量提供的信息找到该文件,实施对文件的操作。习惯上也笼统地把 fp 称为指向一个文
件的指针。
文件在进行读写操作之前要先打开,使用完毕要关闭。所谓打开文件,实际上是建立文件的各种有关信息,并使文件指针指向该文件,以便进行其它操作。关闭文件则断开指针与文件之间的联系,也就禁止再对该文件进行操作。
在C语言中,文件操作都是由库函数来完成的。在本章内将介绍主要的文件操作函数。
文件打开(fopen 函数)
fopen 函数用来打开一个文件,其调用的一般形式为:
文件指针名=fopen(文件名,使用文件方式);
其中,
- “文件指针名”必须是被说明为 FILE 类型的指针变量;
- “文件名”是被打开文件的文件名;
- “使用文件方式”是指文件的类型和操作要求;
- “文件名”是字符串常量或字符串数组
例如:FILE *fp; fp=("file a","r");
其意义是在当前目录下打开文件 file a,只允许进行“读”操作,并使 fp 指向该文件。
又如:
FILE *fphzk
fphzk=("c:\\hzk16","rb")
其意义是打开 C 驱动器磁盘的根目录下的文件 hzk16,这是一个二进制文件,只允许按二进制方式进行读操作。两个反斜线“\\ ”中的第一个表示转义字符,第二个表示根目录。
使用文件的方式共有 12 种,下面给出了它们的符号和意义。
对于文件使用方式有以下几点说明:
1) 文件使用方式由 r,w,a,t,b,+六个字符拼成,各字符的含义是:
- r(read): 读;
- w(write): 写 ;
- a(append): 追加 ;
- t(text): 文本文件,可省略不写 ;
- b(banary): 二进制文件 ;
- +: 读和写
2) 凡用“r”打开一个文件时,该文件必须已经存在,且只能从该文件读出。
3) 用“w”打开的文件只能向该文件写入。若打开的文件不存在,则以指定的文件名建立该文件,若打开的文件已经存在,则将该文件删去,重建一个新文件。
4) 若要向一个已存在的文件追加新的信息,只能用“a”方式打开文件。但此时该文件必须是存在的,否则将会出错。
5) 在打开一个文件时,如果出错,fopen 将返回一个空指针值 NULL。在程序中可以用这一信息来判别是否完成打开文件的工作,并作相应的处理。
因此常用以下程序段打开文件:
if((fp=fopen("c:\\hzk16","rb")==NULL)
{
printf("\nerror on open c:\\hzk16 file!");
getch();
exit(1);
}
这段程序的意义是,如果返回的指针为空,表示不能打开 C 盘根目录下的 hzk16 文件,则给出提示信息“error on open c:\ hzk16 file!”,下一行 getch()的功能是从键盘输入一个字符,但不在屏幕上显示。在这里,该行的作用是等待,只有当用户从键盘敲任一键时,程序才继续执行,因此用户可利用这个等待时间阅读出错提示。敲键后执行exit(1)退出程序。
6) 把一个文本文件读入内存时,要将 ASCII 码转换成二进制码,而把文件以文本方式写入磁盘时,也要把二进制码转换成 ASCII 码,因此文本文件的读写要花费较多的转换时间。对二进制文件的读写不存在这种转换。
7) 标准输入文件(键盘),标准输出文件(显示器),标准出错输出(出错信息)是由系统打开的,可直接使用。
文件关闭函数(fclose 函数)
文件一旦使用完毕,应用关闭文件函数把文件关闭,以避免文件的数据丢失等错误。
fclose 函数调用的一般形式是:
fclose(文件指针);
例如
fclose(fp);
正常完成关闭文件操作时,fclose 函数返回值为 0。如返回非零值则表示有错误发生。