百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

Linux编程入门(4)-改变文件的读写位置

sinye56 2024-11-13 12:35 9 浏览 0 评论

当对某个文件进行操作时,我们可以指定文件的读/写位置吗?答案是:当然可以。让我们一起来学习下,如何设置文件的操作位置。

文件读写位置

Linux系统每次打开一个文件,内核会用一个指针来记录该文件的偏移量,有时也称为读写偏移量指针文件偏移量是指执行下一个 read() 或者 write() 操作的文件起始位置,通常是非负整数,用以度量从文件开始处计算的字节数。文件内第一个字节的偏移量为 0。

文件打开时,文件偏移量的值设置为指向文件的开头。以后每次读或者写将自动对其进行调整,以指向已读或已写数据的下一个字节。

当从文件读取数据时,内核从指针所表明的地方开始读取指定的字节,然后移动指针,指向下一个未被读取的字节。向文件写入数据的操作类似。

指针是与文件描述符相关联的,而不是与文件关联的。如果两个程序同时打开一个文件,这时会有两个指针,两个程序对文件的读操作不会互相干扰。

系统调用

系统函数 lseek() 可以改变已经打开文件的当前读写位置。其函数原型如下

#include <sys/types.h>
#include <unistd.h>

off_t lseek(int fd, off_t offset, int whence);

针对文件描述符 fd 所指代的已打开文件,系统调用 lseek() 依照 offsetwhence 参数值调整该文件的偏移量。

参数 fd,已打开文件的描述符。

参数 offset,指定了一个以字节为单位的数值。

参数 whence,表明应该参照哪个基点来解释 offset 参数,应为下列其中之一:

SEEK_SET

将文件的偏移量设置为距文件开始处的 offset 个字节,其值必须为非负数。

SEEK_CUR

将该文件的偏移量设置为距离当前位置处的 offset 个字节,即当前偏移量加 offset(可为正或负)。

SEEK_END

将该文件的偏移量设置为距离文件结尾处的 offset 个字节,即文件偏移量设置为文件长度加 offset(可为正或负)。

lseek() 返回值 ,调用成功,会返回新的文件偏移量;调用失败,返回 -1。

通常,文件偏移量应当是一个非负整数。但是,某些设备也可能允许负的偏移量。对于普通文件,其偏移量必须是非负值。由于偏移量可能为负值,所以在判断 lseek 的返回值时,要测试它是否等于 -1,而不要测试它是否小于 0。

系统调用 lseek() ,只是调整内核中与文件描述符相关的文件偏移量记录,并没有引起任何 I/O 操作,即没有对任何物理设备进行访问。

lseek() 并不适用于所有类型的文件。例如,不允许将 lseek() 应用于管道、 FIFO、 socket 或者终端等。一旦如此, 调用将会失败。

文件空洞

如果文件偏移超过文件结尾,可以吗?再执行 I/O 操作会出现什么现象?

文件的偏移量可以超出文件结尾。这种情况下,执行 read() 调用将返回 0,表示已经到达文件结尾。执行 write() 函数却可以在文件结尾之后的任意位置写入数据。新写入数据的文件位置与文件结尾之间的空间,会构成一个空洞,即文件空洞。从编程的角度来看,文件空洞是存在字节的,读取空洞将返回 0(空字节)

文件的空洞不占用任何磁盘空间。如果在文件空洞中写入了数据,文件系统才会为之分配磁盘块。带空洞的文件叫做稀疏文件。其优势在于,与为实际需要的空字节分配磁盘相比,稀疏填充的文件会占用较少的磁盘空间。

空洞的存在,意味着一个文件名义上的大小可能要比其占用的磁盘存储总量要大(有时会大出许多)。向文件空洞中写入字节,内核需要为其分配存储单元,即使文件大小不变,系统的可用磁盘空间也将减少。

示例代码

让我们来写一段代码,来进行实验,调整文件偏移量,产生空洞文件。代码如下

#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>

char buf1[] = "abcdefghijk";
char buf2[] = "ABCDEFGHIJK";

int main(void)
{
  int fd;

  /* 创建新文件 */
  if((fd = creat("file.hole", 0660)) < 0)
  {
    perror("creat error");
  }

  /* 向文件写入缓冲区buf1数据 */
  if(write(fd, buf1, 11) != 11)
  {
    perror("buf1 write error");
  }

  /* 以当前偏移量为基点,向后调整文件偏移量 */
  if(lseek(fd, 16384, SEEK_SET) == -1)
  {
    perror("lseek error");
  }

  /* 在新的偏移量位置写入缓冲区buf2数据 */
  if(write(fd, buf2, 11) != 11)
  {
    perror("buf2 write error");
  }

  exit(0);
}

编译、运行后的结果如下:

$ gcc lseek.c -o lseek1

$ ./lseek1 

$ ls -l file.hole  /* 查看文件大小 */
-rw-rw---- 1 user user 16395 11月  9 23:13 file.hole

$ od -c file.hole  /* 查看实际内容 */
0000000   a   b   c   d   e   f   g   h   i   j   k  \0  \0  \0  \0  \0
0000020  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0
*
0040000   A   B   C   D   E   F   G   H   I   J   K
0040013

使用 od 命令查看该文件的实际内容。命令中的 -c 选项表示以字符方式打印文件内容。从中可以看到,文件中间的 21 个未写入字节都被读成 0。每一行开始的 7 位数是以八进制形式表示的字节偏移量。

总结

经过本篇文章,学习了文件偏移相关内容,以及如何显示地调整文件偏移量。

至此,文件 I/O 基本的系统函数全部学习完毕。包括:

open、close、read、write、lseek。

OK,接下来,我们继续其他内容的学习。

相关推荐

RHEL8和CentOS8怎么重启网络

本文主要讲解如何重启RHEL8或者CentOS8网络以及如何解决RHEL8和CentOS8系统的网络管理服务报错,当我们安装好RHEL8或者CentOS8,重启启动网络时,会出现以下报错:...

Linux 内、外网双网卡路由配置

1.路由信息的影响Linux系统中如果有多张网卡的情况下,如果路由信息配置不正确,...

Linux——centos7修改网卡名

修改网卡名这个操作可能平时用不太上,可作为了解。修改网卡默认名从ens33改成eth01.首先修改网卡配置文件名(建议将原配置文件进行备份)...

CentOS7下修改网卡名称为ethX的操作方法

?Linux操作系统的网卡设备的传统命名方式是eth0、eth1、eth2等,而CentOS7提供了不同的命名规则,默认是基于固件、拓扑、位置信息来分配。这样做的优点是命名全自动的、可预知的...

Linux 网卡名称enss33修改为eth0

一、CentOS修改/etc/sysconfig/grub文件(修改前先备份)为GRUB_CMDLINE_LINUX变量增加2个参数(net.ifnames=0biosdevname=0),修改完成...

CentOS下双网卡绑定,实现带宽飞速

方式一1.新建/etc/sysconfig/network-scripts/ifcfg-bond0文件DEVICE=bond0IPADDR=191.3.60.1NETMASK=255.255.2...

linux 双网卡双网段设置路由转发

背景网络情况linux双网卡:网卡A(ens3)和网卡B(...

Linux-VMware设置网卡保持激活

Linux系统只有在激活网卡的状态下才能去连接网络,进行网络通讯。修改配置文件(永久激活网卡)...

VMware虚拟机三种网络模式

01.VMware虚拟机三种网络模式由于linux目前很热门,越来越多的人在学习linux,但是买一台服务放家里来学习,实在是很浪费。那么如何解决这个问题?虚拟机软件是很好的选择,常用的虚拟机软件有v...

Rocky Linux 9/CentOS Stream 9修改网卡配置/自动修改主机名(实操)

推荐...

2023年最新版 linux克隆虚拟机 解决网卡uuid重复问题

问题描述1、克隆了虚拟机,两台虚拟机里面的ip以及网卡的uuid都是一样的2、ip好改,但是uuid如何改呢?解决问题1、每台主机应该保证网卡的UUID是唯一的,避免后面网络通信有问题...

Linux网卡的Vlan配置,你可能不了解的玩法

如果服务器上连的交换机端口已经预先设置了TRUNK,并允许特定的VLAN可以通过,那么服务器的网卡在配置时就必须指定所属的VLAN,否则就不通了,这种情形在虚拟化部署时较常见。例如在一个办公环境中,办...

Centos7 网卡绑定

1、切换到指定目录#备份网卡数据cd/etc/sysconfig/network-scriptscpifcfg-enp5s0f0ifcfg-enp5s0f0.bak...

Linux搭建nginx+keepalived 高可用(主备+双主模式)

一:keepalived简介反向代理及负载均衡参考:...

Linux下Route 路由指令使用详解

linuxroute命令用于显示和操作IP路由表。要实现两个不同子网之间的通信,需要一台连接两个网络的路由器,或者同时位于两个网络的网关来实现。在Linux系统中,设置路由通常是为了解决以下问题:该...

取消回复欢迎 发表评论: