百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

Oracle压缩黑科技(一)—基础表压缩

sinye56 2024-10-15 15:31 17 浏览 0 评论

原文链接 https://www.red-gate.com/simple-talk/sql/oracle/compression-oracle-basic-table-compression/

译者 周天鹏

在关于Oracle压缩的这一系列文章中,我们会研究下传统Oracle数据库系统的各类压缩方式,这意味着该系列文章的目录结构大概是:

1. 基础表压缩

2. OLTP表压缩

3. 索引压缩

但是,不讨论Exadata的hybrid columnar compression (HCC)。

在这三种压缩技术中,索引压缩和基础表压缩是产品自带的核心组件,但是,OLTP压缩需要独立的“Advanced Compression Option (ACO)” license授权。再第一篇文章中,我们先用基础表压缩造一些数据,把对数据更新删除的问题留到第二篇文章中,最后基于前两篇的铺垫,我们再研究下OLTP的压缩。索引压缩单独留在第四、第五篇中探讨。

本文主要目的是解答一些关于表压缩相关的经常被问到的问题。

基础表压缩何时起作用?

人们经常问道,“我如何造压缩数据”,“Oracle如何解压这些数据块”,“压缩对性能会造成什么影响”,还有一个人们在使用任何新特性前都会问的问题“有啥不为人知的副作用吗?”

回答第一个问题最简单的方法就是通过一个实际例子。这里有5条SQL,跑完后我们先收集表的统计信息,然后查一下表里有多少数据块和一些其他相当信息。

-- 1. Baseline CTAS

create table t1

as

select * from all_objects where rownum <= 50000;

-- 2. CTAS with basic compression enabled

create table t1 compress basic

as

select * from all_objects where rownum <= 50000;

-- 3. Normal insert into empty table defined as compressed

create table t1 compress basic

as

select * from all_objects where rownum = 0;

insert into t1 select * from all_objects where rownum <= 50000

-- 4. Direct path insert into empty table defined as compressed

create table t1 compress basic

as

select * from all_objects where rownum = 0;

insert /*+ append */ into t1 select * from all_objects where rownum <= 50000

-- 5. CTAS without compression, then change to compressed

create table t1

as

select * from all_objects where rownum <= 50000;

alter table t1 compress basic;

alter table t1 move

每一条SQL执行完我都会运行下面的SQL查询数据块的信息:

select blocks, pct_free , compression, compress_for

from user_tables

where table_name = 'T1';

当然也有其他方法,我们可以将表空间定义为压缩的,这样在里面创建的所有表就会被默认进行压缩;我们还可以将分区表的分区或者子分区进行压缩;我们甚至可以将分区表定义为默认压缩,这样新增的分区就都是压缩的了。

我用下面这个图表总结了上述sql代码的结果:

test5有两个结果,一个是alter table move之前的,一个是之后的

当我在CTAS(create table as select)加了压缩选项时, Oracle自动将pctfree置为0 —— 这将数据块的数量显著减少,只用了189个数据块。pctfree为0意味着Oracle认为这张表将会变成read only的。但是,pctfree当然也可以设置为一个非空的值,这在后面的章节会讲。

在第三第四个测试中,我创建了一个启用了压缩的空表,然后插入数据。正如你所看到的,只有使用direct path insert,插入的数据才会被压缩。普通的insert操作并不会压缩数据。(insert后的数据块644个,相比CTAS 714个要少一些的原因是因为pctfree从10变为了0)

最后一个测试告诉我们,将表从非压缩改为压缩之后,对现存的数据并没有影响。如果你想将未压缩的数据进行压缩,需要先改变表的定义,然后move表。但是,move后需要立即重建表上的所有索引。

压缩原理并非如我们所想

Oracle如何进行压缩的呢?实际上,Oracle并不会进行压缩。他做的仅仅是块级别的深度复制。想象一下,你在一个数据块里有下面三行数据:

(‘XXXX’, ‘abcdef’, 254.32, ‘CLOSED’)

(‘XXXX’, ‘pqrstu’, 17.12, ‘CLOSED’)

(‘AAAA’, ‘abcdef’, 99.99, ‘CLOSED’)

Oracle会发现‘XXXX’出现了两次,‘abcdef’出现了两次,‘CLOSED’出现了三次。这样,就可以用这个块里重复的值创建一个字典表。压缩后的数据如下

T1 (‘XXXX’)

T2 (‘abcdef’)

T3 (‘CLOSED’)

(T1, T2, 254.32, T3)

(T1, ‘pqrstu’, 17.12, T3)

(‘AAAA’, T2, 99.99, T3)

其实,Oracle比这还要聪明,它可以重新排列块中的字段顺序,使得多个字段可以用一个标志代替。在我们的例子中,三行数据都有T1和T3。Oracle可以重排列这些字段,让这些标志尽可能的在一块,以至于可以用创建一个标志来代替两个标志的组合。最终数据会变成这样:

T1 (‘XXXX’, T2) -- 这是一个由数值和标志组合成的标志

T2 (‘CLOSED’)

T3 (‘abcdef’)

(T1, T3, 254.32) -- 注意这行只有了三列

(T1, ‘pqrstu’, 17.12) -- 同上

(‘AAAA’, T2, T3, 99.99)

让我们通过dump数据块里的数据来更进一步观察压缩的内部实现原理。这里是一个压缩表中的数据块中的第一个片段:

perm_9ir2[4]={ 2 0 1 3 }

这个表有4个数据块,但是对于这个块,Oracle重新排列了字段的顺序,意思是:字段0放在了第二位,字段1在第三位,字段2在第一位,字段3在第四位。

0x24:pti[0] nrow=65 offs=0

0x28:pti[1] nrow=400 offs=65

如上,这是数据块里的两个“表”,第一个是存放标志的“表”(其实就是字典表),有65个标志,在块的行目录中从0开始。第二个是真正的“表”,有400行,在块的行目录中从65开始。这意味着这个块的行目录一共有465个条目。

如果我们从第二个“表”(真正的数据表,而不是字典表)开始看,我们会发现这和普通的堆表中的数据块dump出来的一行没什么两样。但这里有一些特殊的点需要注意。

tab 1, row 0, @0x1b28

tl: 5 fb: --H-FL-- lb: 0x0 cc: 4

col 0: [ 4] 41 41 41 41

col 1: [10] 41 41 41 41 41 41 41 41 41 41

col 2: [ 2] c1 02

col 3: [10] 20 20 20 20 20 20 20 20 20 31

bindmp: 2c 00 01 04 31

基于列的长度(方括号中的数据),行的长度是26个字节(4+10+2+10),加上四个列4个字节 和 flag byte(fb:),lock byte(lb:),column count(cc:)每个1字节 - 但总的实际长度(tl:)只有5字节。而且最后一行也展示了这5个字节实际的数据。这5个字节分别是flag byte (0x2c = ‘–H-FL’), lock byte和存储的列数量。然后剩下2字节告诉我们有一个列是一个标志代表4个连续的值,而且我们需要到字典表中找0x31号标志。接下来让我们看下字典表中的49行(0x31):

tab 0, row 49, @0x1ed0

tl: 19 fb: --H-FL-- lb: 0x0 cc: 4

col 0: [ 4] 41 41 41 41

col 1: [10] 41 41 41 41 41 41 41 41 41 41

col 2: [ 2] c1 02

col 3: [10] 20 20 20 20 20 20 20 20 20 31

bindmp: 00 08 04 36 40 ca c1 02 d2 20 20 20 20 20 20 20 20 20 31

这个标志看起来几乎和行一样 - 但是标志的总长是19字节。所以我们看下dump出来的数据。前两个字节告诉我们这个标志在这个块里用了8次。下一个字节告诉我们标志中有4个列,通过一些编码,剩下的两个字节告诉我们这个标志的前两个字段的值实际存储在在0x36(54)和0x40(64)号标志中。后两个字段直接就是实际的数据了。

所以,通过我们的方法,从行目录到行、标志,我们可以扩展一个5字节的条目到一个完整的26字节的行。

通过我们对数据块dump出的数据进行跟踪,这里还有许多知识值得学习。

1. Oracle不会解压这些数据,他只是根据你的需求,用字典表和数据表中的数据将行重构出来。

2. 重构行的时候很可能会消耗一些额外的CPU,在做全表扫描时将尤为明显。

3. 有一个副作用,为了能重构行,Oracle必须持有某些块一段时间。所以你可能发现你的sql很少发生“consistent gets – examination”的等待,因为大部分时间花在了“cache buffers chains”的latch上面。

总 结

依然有很多关于压缩的副作用值得一提,尤其是删除和更新表的时候,这也讲引导着我们去实现OLTP的压缩 - 将来的文章会讲。

我们从这第一篇文章中发现看到了:

1. 基础压缩只有在direct path inserts时有效,普通的DML不会压缩数据。

2. Oracle会默认把压缩表的PCTFREE置为0,这也很好的表明,Oracle认为建表后你不会再修改数据。

3. 基础表压缩仅仅是把重复的值进行深度复制,但Oracle足够聪明来最小化数据占用的空间。

4. 这种深度复制机制意味着Oracle不需要解压数据,只需要把块cache在buffer cache中然后在PGA里重构行即可,该操作属于CPU密集型。

相关推荐

程序员:JDK的安装与配置(完整版)_jdk的安装方法

对于Java程序员来说,jdk是必不陌生的一个词。但怎么安装配置jdk,对新手来说确实头疼的一件事情。我这里以jdk10为例,详细的说明讲解了jdk的安装和配置,如果有不明白的小伙伴可以评论区留言哦下...

Linux中安装jdk并配置环境变量_linux jdk安装教程及环境变量配置

一、通过连接工具登录到Linux(我这里使用的Centos7.6版本)服务器连接工具有很多我就不一一介绍了今天使用比较常用的XShell工具登录成功如下:二、上传jdk安装包到Linux服务器jdk...

麒麟系统安装JAVA JDK教程_麒麟系统配置jdk

检查检查系统是否自带java在麒麟系统桌面空白处,右键“在终端打开”,打开shell对话框输入:java–version查看是否自带java及版本如图所示,系统自带OpenJDK,要先卸载自带JDK...

学习笔记-Linux JDK - 安装&amp;配置

前提条件#检查是否存在JDKrpm-qa|grepjava#删除现存JDKyum-yremovejava*安装OracleJDK不分系统#进入安装文件目...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

测试员必备:Linux下安装JDK 1.8你必须知道的那些事

1.简介在Oracle收购Sun后,Java的一系列产品就被整合到Oracle官网中,打开官网乍眼一看也不知道去哪里下载,还得一个一个的摸索尝试,而且网上大多数都是一些Oracle收购Sun前,或者就...

Linux 下安装JDK17_linux 安装jdk1.8 yum

一、安装环境操作系统:JDK版本:17二、安装步骤第一步:下载安装包下载Linux环境下的jdk1.8,请去官网(https://www.oracle.com/java/technologies/do...

在Ubuntu系统中安装JDK 17并配置环境变量教程

在Ubuntu系统上安装JDK17并配置环境变量是Java开发环境搭建的重要步骤。JDK17是Oracle提供的长期支持版本,广泛用于开发Java应用程序。以下是详细的步骤,帮助你在Ubuntu系...

如何在 Linux 上安装 Java_linux安装java的步骤

在桌面上拥抱Java应用程序,然后在所有桌面上运行它们。--SethKenlon(作者)无论你运行的是哪种操作系统,通常都有几种安装应用程序的方法。有时你可能会在应用程序商店中找到一个应用程序...

Windows和Linux环境下的JDK安装教程

JavaDevelopmentKit(简称JDK),是Java开发的核心工具包,提供了Java应用程序的编译、运行和开发所需的各类工具和类库。它包括了JRE(JavaRuntimeEnviro...

linux安装jdk_linux安装jdk软连接

JDK是啥就不用多介绍了哈,外行的人也不会进来看我的博文。依然记得读大学那会,第一次实验课就是在机房安装jdk,编写HelloWorld程序。时光飞逝啊,一下过了十多年了,挣了不少钱,买了跑车,娶了富...

linux安装jdk,全局配置,不同用户不同jdk

jdk1.8安装包链接:https://pan.baidu.com/s/14qBrh6ZpLK04QS8ogCepwg提取码:09zs上传文件解压tar-zxvfjdk-8u152-linux-...

运维大神教你在linux下安装jdk8_linux安装jdk1.7

1.到官网下载适合自己机器的版本。楼主下载的是jdk-8u66-linux-i586.tar.gzhttp://www.oracle.com/technetwork/java/javase/downl...

window和linux安装JDK1.8_linux 安装jdk1.8.tar

Windows安装JDK1.8的步骤:步骤1:下载JDK打开浏览器,找到JDK下载页面https://d.injdk.cn/download/oraclejdk/8在页面中找到并点击“下载...

最全的linux下安装JavaJDK的教程(图文详解)不会安装你来打我?

默认已经有了linux服务器,且有root账号首先检查一下是否已经安装过java的jdk任意位置输入命令:whichjava像我这个已经安装过了,就会提示在哪个位置,你的肯定是找不到。一般我们在...

取消回复欢迎 发表评论: