Linux编程入门(4)-改变文件的读写位置
sinye56 2024-11-13 12:35 9 浏览 0 评论
当对某个文件进行操作时,我们可以指定文件的读/写位置吗?答案是:当然可以。让我们一起来学习下,如何设置文件的操作位置。
文件读写位置
Linux系统每次打开一个文件,内核会用一个指针来记录该文件的偏移量,有时也称为读写偏移量或指针。文件偏移量是指执行下一个 read() 或者 write() 操作的文件起始位置,通常是非负整数,用以度量从文件开始处计算的字节数。文件内第一个字节的偏移量为 0。
文件打开时,文件偏移量的值设置为指向文件的开头。以后每次读或者写将自动对其进行调整,以指向已读或已写数据的下一个字节。
当从文件读取数据时,内核从指针所表明的地方开始读取指定的字节,然后移动指针,指向下一个未被读取的字节。向文件写入数据的操作类似。
指针是与文件描述符相关联的,而不是与文件关联的。如果两个程序同时打开一个文件,这时会有两个指针,两个程序对文件的读操作不会互相干扰。
系统调用
系统函数 lseek() 可以改变已经打开文件的当前读写位置。其函数原型如下
#include <sys/types.h>
#include <unistd.h>
off_t lseek(int fd, off_t offset, int whence);
针对文件描述符 fd 所指代的已打开文件,系统调用 lseek() 依照 offset 和 whence 参数值调整该文件的偏移量。
参数 fd,已打开文件的描述符。
参数 offset,指定了一个以字节为单位的数值。
参数 whence,表明应该参照哪个基点来解释 offset 参数,应为下列其中之一:
SEEK_SET
将文件的偏移量设置为距文件开始处的 offset 个字节,其值必须为非负数。
SEEK_CUR
将该文件的偏移量设置为距离当前位置处的 offset 个字节,即当前偏移量加 offset(可为正或负)。
SEEK_END
将该文件的偏移量设置为距离文件结尾处的 offset 个字节,即文件偏移量设置为文件长度加 offset(可为正或负)。
lseek() 返回值 ,调用成功,会返回新的文件偏移量;调用失败,返回 -1。
通常,文件偏移量应当是一个非负整数。但是,某些设备也可能允许负的偏移量。对于普通文件,其偏移量必须是非负值。由于偏移量可能为负值,所以在判断 lseek 的返回值时,要测试它是否等于 -1,而不要测试它是否小于 0。
系统调用 lseek() ,只是调整内核中与文件描述符相关的文件偏移量记录,并没有引起任何 I/O 操作,即没有对任何物理设备进行访问。
lseek() 并不适用于所有类型的文件。例如,不允许将 lseek() 应用于管道、 FIFO、 socket 或者终端等。一旦如此, 调用将会失败。
文件空洞
如果文件偏移超过文件结尾,可以吗?再执行 I/O 操作会出现什么现象?
文件的偏移量可以超出文件结尾。这种情况下,执行 read() 调用将返回 0,表示已经到达文件结尾。执行 write() 函数却可以在文件结尾之后的任意位置写入数据。新写入数据的文件位置与文件结尾之间的空间,会构成一个空洞,即文件空洞。从编程的角度来看,文件空洞是存在字节的,读取空洞将返回 0(空字节) 。
文件的空洞不占用任何磁盘空间。如果在文件空洞中写入了数据,文件系统才会为之分配磁盘块。带空洞的文件叫做稀疏文件。其优势在于,与为实际需要的空字节分配磁盘相比,稀疏填充的文件会占用较少的磁盘空间。
空洞的存在,意味着一个文件名义上的大小可能要比其占用的磁盘存储总量要大(有时会大出许多)。向文件空洞中写入字节,内核需要为其分配存储单元,即使文件大小不变,系统的可用磁盘空间也将减少。
示例代码
让我们来写一段代码,来进行实验,调整文件偏移量,产生空洞文件。代码如下
#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
char buf1[] = "abcdefghijk";
char buf2[] = "ABCDEFGHIJK";
int main(void)
{
int fd;
/* 创建新文件 */
if((fd = creat("file.hole", 0660)) < 0)
{
perror("creat error");
}
/* 向文件写入缓冲区buf1数据 */
if(write(fd, buf1, 11) != 11)
{
perror("buf1 write error");
}
/* 以当前偏移量为基点,向后调整文件偏移量 */
if(lseek(fd, 16384, SEEK_SET) == -1)
{
perror("lseek error");
}
/* 在新的偏移量位置写入缓冲区buf2数据 */
if(write(fd, buf2, 11) != 11)
{
perror("buf2 write error");
}
exit(0);
}
编译、运行后的结果如下:
$ gcc lseek.c -o lseek1
$ ./lseek1
$ ls -l file.hole /* 查看文件大小 */
-rw-rw---- 1 user user 16395 11月 9 23:13 file.hole
$ od -c file.hole /* 查看实际内容 */
0000000 a b c d e f g h i j k \0 \0 \0 \0 \0
0000020 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0
*
0040000 A B C D E F G H I J K
0040013
使用 od 命令查看该文件的实际内容。命令中的 -c 选项表示以字符方式打印文件内容。从中可以看到,文件中间的 21 个未写入字节都被读成 0。每一行开始的 7 位数是以八进制形式表示的字节偏移量。
总结
经过本篇文章,学习了文件偏移相关内容,以及如何显示地调整文件偏移量。
至此,文件 I/O 基本的系统函数全部学习完毕。包括:
open、close、read、write、lseek。
OK,接下来,我们继续其他内容的学习。
相关推荐
- RHEL8和CentOS8怎么重启网络
-
本文主要讲解如何重启RHEL8或者CentOS8网络以及如何解决RHEL8和CentOS8系统的网络管理服务报错,当我们安装好RHEL8或者CentOS8,重启启动网络时,会出现以下报错:...
- Linux 内、外网双网卡路由配置
-
1.路由信息的影响Linux系统中如果有多张网卡的情况下,如果路由信息配置不正确,...
- Linux——centos7修改网卡名
-
修改网卡名这个操作可能平时用不太上,可作为了解。修改网卡默认名从ens33改成eth01.首先修改网卡配置文件名(建议将原配置文件进行备份)...
- CentOS7下修改网卡名称为ethX的操作方法
-
?Linux操作系统的网卡设备的传统命名方式是eth0、eth1、eth2等,而CentOS7提供了不同的命名规则,默认是基于固件、拓扑、位置信息来分配。这样做的优点是命名全自动的、可预知的...
- Linux 网卡名称enss33修改为eth0
-
一、CentOS修改/etc/sysconfig/grub文件(修改前先备份)为GRUB_CMDLINE_LINUX变量增加2个参数(net.ifnames=0biosdevname=0),修改完成...
- CentOS下双网卡绑定,实现带宽飞速
-
方式一1.新建/etc/sysconfig/network-scripts/ifcfg-bond0文件DEVICE=bond0IPADDR=191.3.60.1NETMASK=255.255.2...
- linux 双网卡双网段设置路由转发
-
背景网络情况linux双网卡:网卡A(ens3)和网卡B(...
- Linux-VMware设置网卡保持激活
-
Linux系统只有在激活网卡的状态下才能去连接网络,进行网络通讯。修改配置文件(永久激活网卡)...
- VMware虚拟机三种网络模式
-
01.VMware虚拟机三种网络模式由于linux目前很热门,越来越多的人在学习linux,但是买一台服务放家里来学习,实在是很浪费。那么如何解决这个问题?虚拟机软件是很好的选择,常用的虚拟机软件有v...
- 2023年最新版 linux克隆虚拟机 解决网卡uuid重复问题
-
问题描述1、克隆了虚拟机,两台虚拟机里面的ip以及网卡的uuid都是一样的2、ip好改,但是uuid如何改呢?解决问题1、每台主机应该保证网卡的UUID是唯一的,避免后面网络通信有问题...
- Linux网卡的Vlan配置,你可能不了解的玩法
-
如果服务器上连的交换机端口已经预先设置了TRUNK,并允许特定的VLAN可以通过,那么服务器的网卡在配置时就必须指定所属的VLAN,否则就不通了,这种情形在虚拟化部署时较常见。例如在一个办公环境中,办...
- Centos7 网卡绑定
-
1、切换到指定目录#备份网卡数据cd/etc/sysconfig/network-scriptscpifcfg-enp5s0f0ifcfg-enp5s0f0.bak...
- Linux搭建nginx+keepalived 高可用(主备+双主模式)
-
一:keepalived简介反向代理及负载均衡参考:...
- Linux下Route 路由指令使用详解
-
linuxroute命令用于显示和操作IP路由表。要实现两个不同子网之间的通信,需要一台连接两个网络的路由器,或者同时位于两个网络的网关来实现。在Linux系统中,设置路由通常是为了解决以下问题:该...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle忘记用户名密码 (59)
- oracle11gr2安装教程 (55)
- mybatis调用oracle存储过程 (67)
- oracle spool的用法 (57)
- oracle asm 磁盘管理 (67)
- 前端 设计模式 (64)
- 前端面试vue (56)
- linux格式化 (55)
- linux图形界面 (62)
- linux文件压缩 (75)
- Linux设置权限 (53)
- linux服务器配置 (62)
- mysql安装linux (71)
- linux启动命令 (59)
- 查看linux磁盘 (72)
- linux用户组 (74)
- linux多线程 (70)
- linux设备驱动 (53)
- linux自启动 (59)
- linux网络命令 (55)
- linux传文件 (60)
- linux打包文件 (58)
- linux查看数据库 (61)
- linux获取ip (64)
- linux进程通信 (63)