C语言之输入输出
标准库 IO
输入输出功能并非C语言的组成部分,ANSI标准定义了相关的库函数
输入输出 <stdio.h>
流stream是与设备关联的数据的源或者目的地。
- 文本流:由文本行组成的序列
不同系统的特性可能不一样,比如行最大长度和行结束符 - 二进制流:未经处理的字节序列
程序运行时,默认打开 stdin, stdout, stderr
标准 IO 常量
- EOF:文件尾,实际值是几个字符避免混淆
- FOPEN_MAX:一个程序同时最多能够打开的文件数量,与编译器有关,值至少为 8
- FILENAM_MAX:编译器支持的最长文件名
文件流操作
文件指针指向包含文件信息的结构,包括缓冲区,读写状态等
打开与关闭
FILE *fopen(const char *filename, const char *mode); // 打开文件流
/*
mode:
* r, 打开读
* w, 打开或创建写,删除原有内容
* a, 打开或者创建,文件尾追加
* +, 更新,读或写,交叉操作前需要执行fflush或者定位操作
* r+, 打开文件更新(读和写)
* w+, 创建文件更新,删除原有内容
* a+, 打开或创建文件,文件尾更新
* b, 二进制流模式
应始终检查返回值
*/
FILE *freopen(const char *filename, const char *mode, FILE *stream); // 先关闭再打开文件流
FILE *fdopen(int fd, const char *type); // POSIX标准,常用于由创建管道和网络通信通道函数返回的描述符,不能直接用 fopen 打开
// type 参数: r, w, a, (+)
// 注意读写模式下读写操作之间需要进行调用定位函数
int fclose(FILE *stream); // 刷新输出缓冲,释放系统缓冲区,关闭流
int fileno(FILE *fp); // POSIX 标准
流的定向
标准IO可用于单字节和多字节字符集,具体由流的定向决定。
- freopen函数清除一个流的定向
- fwide函数设置流的定向、
#include <stdio.h>
#include <wchar.h>
int fiwde(FILE *fp, int mode);
/*
mode<0, 试图设置为单字节
mode>0,试图设置为多字节
mode=0,不设置定向,返回流的定向
不会改变已经设置的流定向
*/
文件操纵函数
重命名
int remove(FILE *stream); // 删除文件
int rename(const char *oldname, const char *newname); // 重命名文件
临时文件
FILE *tmpfile(void); // 以`wb+`模式创建临时文件,在关闭或者程序结束时自动删除
// 实现上tmpnam,创建文件,unlink(不会删除内容),文件的关闭会在程序结束中自动进行
char *tmpnam(char s[L_tmpnam]); // 创建不同现有文件名的字符串,NULL返回指向静态数组的指针
// UNIX 优势是不存在时间间隙,避免其他进程创建同名文件
char *mkdtemp(char *temple); // 创建目录
int mkstmp(char *temple); // 创建文件,不会自动删除
缓冲操作
标准IO提供缓冲的目的是尽可能减少read/write的调用次数
全缓冲:缓冲区满了才进行实际IO操作
行缓冲:遇到换行符才进行IO操作
- 行缓冲的长度是固定的,行缓冲满了即使没有换行符也会进行IO操作
- 标准IO要求从不带缓冲或者行缓冲(需要从内核请求数据)获取数据,会立即刷新所有行缓冲的输出流
不带缓冲
ISO C标准
- 当且仅当标准输入和标准输出不指向交互式设备才是全缓冲的
- 标准错误不会是全缓冲的
默认情况
- 标准错误不带缓冲
- 若是指向终端设备的流,则是行缓冲的,否则是全缓冲的
更换缓冲的类型:流被打开之后,且在执行任何操作之前
int fflush(FILE *stream); // 刷新缓冲区
/*
- 对于输出流,刷新写入缓冲区的内容至目标文件
- 对于输入流,其结果是未定义的
- NULL,刷新所有的缓冲区
实际使用技巧:每个调试 printf 之后立马调用 fflush
*/
int setvbuf(FILE *stream, char *buf, int mode, size_t size); // 必须在执行读写操作之前设置缓冲
/*
mode:
- _IOFBF 完全缓冲
- _IOLBF 行缓冲
- _IONBF 不设置缓冲
*/
void setbuf(FILE *stream, char *buf); // char buf[BUFSIZ]
/*
- buff为 NULL, 关闭缓冲
- 否则,等价于 `_IOFBF`
// 注意:buf 不要使用自动变量类型,尽量使用系统缓冲区或者动态分配内存
*/
#TODO#查看流缓冲状态 《UNIX高级环境编程》
读写流操作
字符 IO
#TODO#
输入输出函数家族 《C和指针》P301
int fgetc(FILE *stream); // unsigned char 转 int, 兼容EOF
int getc(FILE *stream); // 等价于 fgetc,注意实现为宏
int getchar(void); // 等价于 getc(stdin)
int fputc(int c, FILE *stream);
int putc(int c, FILE *stream); // 等价于 fputc, 注意实现为宏
int putchar(int c); // 等价于 fputc(stdout)
// 只有fgetc和fputc是函数,其他都是宏
int ungetc(int c, FILE *stream); // 将字符退回流中,依赖于当前位置
// 不同于写操作,仅涉及流本身而无关设备存储
未格式化的行IO
char *fgets(char *s, int n, FILE *stream); // 自动包含换行符,\n 换为 \0,最多n-1
char *gets(char *s); // 不自动包含换行符。没有缓冲区长度参数,可能导致越界;不推荐使用,已废弃
int fputs(const char *s, FILE *stream); // 不自动包含换行符\n,逐字符输入任意个数换行符
int puts(const char *s); // 自动添加换行符\n
ssize_t getline(char **lineptr, size_t *n, FILE *stream);
// 根据输入动态分配内存,无需预先确定输入字符串的最大长度
// 在存储的字符串中将换行符替换为字符串结束符'\0'
格式化 IO
int fprintf(FILE *stream, const char *format, ...);
int printf(const char *format, ...); // 等价于 `fprintf(stdout, fotmat, ...)`
int sprintf(char *s, const char *format, ...); // 包含结束符 NUL,无长度参数,可能越界溢出
int snprintf(char *buf, szie_t n, const char *format, ...); // 超出部分截断,出错返回负值
int fdprintf(int fd, const char *format, ...);
// 变长参数列表变体
int vprintf(const char *format, va_list arg);
int vfprintf(FILE *stream, const char *format, va_list arg);
int vsprintf(char *s, const char *format, va_list arg);
转换格式:
普通字符:复制到输出流
转换说明:控制参数的格式转换
开头 %
标志[可选]
-
-
左对齐,缺省为右对齐 -
+
显示正负号 - 空格 有符号值转换
0
宽度不足时填充 0-
#
指定另一种输出形式
-
宽度数值[可选]:指定最小字段宽度
精度数值[可选]:点号开始,后接十进制数值
长度修饰符[可选]:指定参数的长度
- h 按照short/unsigned short 输出
- l 按照long/unsigned long 输出
- L 按照long double 输出
结尾: 转换字符, d, c, s, f, x等
int fscanf(FILE *stream, const char *format, ...);
int scanf(const char *format, ...);
int sscanf(const char *s, char *format, ...);
int fdscanf(int fd, const char *format,...);
// 变长参数列表变体 ...
- 参数必须是指针
- 到文件尾或者出错返回EOF,否则返回实际输入的字符数
转换格式
空格或者制表符
普通字符:匹配下一个输入
转换说明
- 开始标志
%
[可选] - 赋值屏蔽符号
*
[可选] - 最大字段宽度数值[可选]
- 限定符
h\l\L
,指定参数的长度[可选] - 结束标志:转换字符 d,f,c, s, x等等
- 开始标志
#TODO#4种使用场景P309
二进制 IO
直接IO/二进制IO,通常一次处理一个结构,能够处理null字节和换行符。
注意事项:只能用于同一系统,不同系统的偏移对齐以及存储格式可能不同。因此网络通信需要指定规范。
size_t fread(void *buffer, size_t size, size_t nobj, FILE *stream);
size_t fwrite(const void *buffer, size_t size, size_t nobj, FILE *stream);
/* 返回值是实际读写的元素的个数而非字节数
fread:少于nobj, 出错或者EOF,需要进一步分辨
fwrite:少于nobj,错误
*/
内存流
无关文件,直接在缓冲区和主存之间进行字节IO。非常适用于字符串。
Linux支持。
FILE *fmemopen(void *buf, size_t size, const char *type); // buf=null, 读写无意义;对于null字节的处理十分特殊
FILE *open_memstream(char **bufp, size_t sizep); // 面向字节的流
FILE *open_wmemstream(wchar_t **bufp, size_t *sizep); // 面向宽字节的流
文件定位函数
- 二进制文件:使用字节偏移量,不一定支持 SEEK_END
- 文本文件:格式不同不能使用字节,orgin=SEEK_SET, offset=0/ftell
int fseek(FILE *stream, long offset, int origin);
/*
- 二进制文件
- origin
- `SEEK_SET` 文件开始处
- `SEEK_CUR` 当前位置
- `SEEK_END` 文件结束处,可能不支持
- 文本文件
- `SEEK_SET`;offset是 0 或者 `ftell`返回值
- `SEEK_CUR`/`SEEK_END`:offset只能是 0
注意事项
- 行末指示符将被清除
- 退回的字符将被丢弃
- 更新模式中的读写操作切换
*/
long ftell(FILE *stream);
void rewind(FILE *stream); // 重置为起始位置
//等价于 `fseek(stream, 0L, SEEK_SET); clearerr(stream);`
// off_t, 大于32位 UNIX 标准
off_t ftello(FILE *fp);
int seeko(FILE *fp, off_t offset, int origin);
// fpos_t ISO C标准,更加通用
int fgetpos(FILE *stream, fpos_t *ptr);
int fsetpos(FILE *stream, const fpos_t *ptr);
错误处理函数
发生错误或者到达文件尾时会设置状态指示符
整型表达式 errno 包含错误编号,定义在 <errno.h>
- 只有库函数失败时才会设置 errno, 成功执行并不会修改 errno
- 任何函数都不会将常量置为0
/* ----- 流错误 -----*/
int feof(FILE *stream); // 流设置了文件结束指示符,返回非0值
int ferror(FILE *stream); // 流设置了错误指示符,返回非0值
int clearerr(FILE *stream); // 清除流的所有指示符
#include <string.h>
char *strerror(int crrno); // 映射错误信息
#include <stdio.h>
int perror(const char *s); // 打印字符串和 errno 错误信息
// 类似于 fprintf(stderr, "%s: %s\n", s, "error essage");
标准IO的替代
标准IO 的效率不高,调用行IO需要进行两次数据的复制
- 快速IO fio: 使用指针而不是复制整行
- sfio: 提高速度,同时推广IO流
- mmap
适用于嵌入式系统的更低内存要求的实现
- uClibc C库
- Newlib C库
参考
- 《C程序设计语言》
- 《UNIX 环境高级编程》