Oracle数据误操作全面恢复实战(r11笔记第78天)
sinye56 2024-09-22 08:22 6 浏览 0 评论
对于DBA来说,面对误操作带来的数据恢复难度,其实很大。主要有以下几个方面:
误操作的影响范围极大,很可能不是删点,改点数据的操作,有时候可能是让人望而兴叹的truncate,drop操作。
数据恢复时需要确认数据损坏的时间点,依此来作为数据恢复的一个基准,该舍弃多少数据,该如何权衡,非常关键。
一旦信息提供错误,是否经得起反复折腾,我想这个对于绝大多数的数据恢复而言,基本都是一锤子买卖,能恢复已经不错了,还要反复恢复。但是一旦出现这种情况,可不能马上乱了阵脚。
灾备方案好不好,一试便知
自己也听了不少的数据灾难案例,其实备份终于一切这个没错,从逻辑层面还有几个地方需要注意,一个就是权限的入口需要控制,不给你犯错误的权限,能够大大减少犯错误的概率,这个之外的重点就是需要有实战演练,积累经验,做到临危不乱。
怎么实战呢,我有一次和同事说,数据恢复,备份策略的规划等,很多具体的场景可能有所不同,但是一主两备的核心业务,我小保证数据能够在一定范围内随时恢复,怎么验证备份恢复策略的有效性呢,我也不看你的方案和计划,我就在一个不定的时间点删点数据,truncate操作一下,然后隔一段时间之后告诉你恢复,能恢复回来那就能证明这个方案是可行的。
灾备方案不容忽视
注意我这里所说的就是一主两备的方案,对于核心业务还是建议这样的方式,备库1和主库在同机房或者同城机房,备库2在异地机房或者同城不同位置的机房,这样能够大大降低出现意外灾害带来的数据灾难。
防完天灾,看看人祸,人为误操作或者应用错误带来的影响其实影响力要大得多,所以这种情况下,我的一般建议都是在备库2开启闪回数据库,然后保留一定的窗口时间延迟。
开启延迟有下面三种方法,重点推荐方法3,使用DG Broker的方式。
方法1:
alter database recover managed standby database delay 120 disconnect from session;
方法2:
alter system set log_archive_dest_3='service=db3 lgwr async delay=120valid_for=(all_logfiles,all_roles) db_unique_name=db3';
方法3:
DG Broker中设置延迟
edit database xxxx set property DelayMins=180;
没有环境,我们“破坏”环境
当然我们就干脆一些,直接破坏下环境(自己创建数据自己破坏),也总结下经验。
我们在主库端创建数据,然后使用truncate删除,当然这个过程我也不会刻意去记录时间。
create table test_recover(id number,name varchar2(30));
就这么几个步骤就可以完整模拟一个破坏场景,来吧,恢复吧。
insert into test_recover select level,'obj'||level from dual connect by level<=10;
commit;
truncate table test_recover;
而且我也不知道具体的时间,大概就是在晚上九点多快10点操作的。
数据恢复基本步骤
这个时候我们先从备库入手。
DGMGRL> show configuration;
因为备库2开启延迟应用,所以我们先取消延迟,使得数据先同步,如果是已有的表drop等操作,延迟应用的优势就出来了。
Configuration - dg_accdb1
Protection Mode: MaxPerformance
Databases:
accdb1 - Primary database
saccdb1 - Physical standby database
s2accdb1 - Physical standby database
Fast-Start Failover: DISABLED
Configuration Status:
SUCCESS
DGMGRL> edit database s2accdb1 set property DelayMins=0;
这个备库还是ADG模式
Property "delaymins" updated
SQL> select open_mode from v$database;
我们关闭日志应用。
OPEN_MODE
--------------------
READ ONLY WITH APPLY
SQL> recover managed standby database cancel;
准备闪回,先把备库置为mount状态
Media recovery complete.
SQL> alter database close;
Database altered.
这个时候问题就来了,我们要闪回到哪个时间点去?
SQL>flashback database to timestamp to_timestamp('xxxxx','yyyy-mm-dd hh24:mi:ss');
这个时间点怎么得到呢,一种就是确认,如果确认不了也可以根据应用日志等信息来辅证,当然严谨的方法是我们通过很精确的方式得到,那就是解析日志。
使用LogMiner解析日志
在主库端通过LogMiner解析日志,我写了两个脚本方便调用。
$ cat check_log.sh
我们通过脚本调用可以看到日志的基本信息,如果是最近的,就可以优先调用看看是否满足。
sqlplus -s / as sysdba <<EOF
set linesize 150
col member format a50
select l.sequence#,l.status ,l.bytes/1024/1024 size_MB,f.member from v\$log l ,v\$logfile f where l.group#=f.group#;
EOF
$ sh check_log.sh
第二个脚本是使用LogMiner解析日志。
SEQUENCE# STATUS SIZE_MB MEMBER
---------- ----------------- --------------------------------------------------
237 CURRENT 500 /U01/app/oracle/oradata/accdb1/redo03.log
236 INACTIVE 500 /U01/app/oracle/oradata/accdb1/redo02.log
235 INACTIVE 500 /U01/app/oracle/oradata/accdb1/redo01.log
$ cat showlog.sh
sqlplus -s / as sysdba <<EOF
execute dbms_logmnr.add_logfile(logfilename=>'$1',options=>dbms_logmnr.new);
execute dbms_logmnr.start_logmnr(options=>dbms_logmnr.dict_from_online_catalog);
alter session set nls_date_format='yyyy-mm-dd hh24:mi:ss';
col xid_scn format a30
col username format a10
col timestamp format a20
col sql_redo format a35
col sql_undo format a35
set pages 1500
set linesize 200
select username,xid||':'||scn xid_scn,timestamp,sql_redo,sql_undo from v\$logmnr_contents where sql_redo not like '%AUD$%';
execute dbms_logmnr.end_logmnr;
EOF
调用脚本的结果如下,就这样我会得到一个基本详细的日志解析内容。
$ sh showlog.sh /U01/app/oracle/oradata/accdb1/redo02.log > /tmp/b.log
几乎没有花什么功夫就搜索到了下面的信息,truncate的一个时间点。
UNKNOWN 0A000D00C44E0100:233170277520 2017-02-17 21:58:06 truncate table test_recover;
我们根据这个时间点来进行恢复。
在备库端开启闪回数据库,闪回到那个时间点附近,比如提前1秒。
SQL> flashback database to timestamp to_timestamp('2017-02-17 21:58:05','yyyy-mm-dd hh24:mi:ss');
过个把分钟就可以轻松搞定,闪回得越早,恢复的时间越长。
如果时间点不满足,可以反复闪回,直到满意为止。
然后我们打开数据库。
SQL> alter database open read only;
查看数据的情况就是最开始期望的了。
Database altered.
SQL> select *from cydba.test_recover;
ID NAME
---------- ------------------------------
1 obj1
2 obj2
3 obj3
4 obj4
5 obj5
6 obj6
7 obj7
8 obj8
9 obj9
10 obj10
恢复后的收尾工作
数据恢复之后,皆大欢喜,我们就可做一些收尾工作,继续开启日志应用。
SQL> alter database close;
Database altered.
SQL> alter database open;
Database altered.
这个时候日志应用是关闭了,因为之前使用了recover managed standby database cancel的命令。
DGMGRL> show configuration;
继续开启日志应用。
Configuration - dg_accdb1
Protection Mode: MaxPerformance
Databases:
accdb1 - Primary database
saccdb1 - Physical standby database
s2accdb1 - Physical standby database
Error: ORA-16766: Redo Apply is stopped
Fast-Start Failover: DISABLED
Configuration Status:
ERROR
DGMGRL> enable database s2accdb1;
就这样数据库的恢复就告一段落。
Enabled.
DGMGRL> show configuration;
Configuration - dg_accdb1
Protection Mode: MaxPerformance
Databases:
accdb1 - Primary database
saccdb1 - Physical standby database
s2accdb1 - Physical standby database
Fast-Start Failover: DISABLED
Configuration Status:
SUCCESS
有几个细小的问题需要格外注意,一个是主备的时间需要确保同步,如果不同步,闪回就会有潜在问题。
相关推荐
- Linux 进程间的通信方式
-
(一)进程的概念进程是操作系统的概念,每当我们执行一个程序时,对于操作系统来讲就是创建一个进程,在这个过程中伴随着资源的分配和释放,可以认为进程是一个程序的一次执行过程。(二)进程间通信的概念进程用户...
- linux进程间通信—管道
-
Linux编程进程间通信(1)管道1、管道概述及相关API应用1.1管道相关的关键概念管道是Linux支持的最初UnixIPC形式之一,具有以下特点:管道是半双工的,数据只能向一个方向流动;需要...
- 由浅入深探讨Linux进程间通信(上篇)
-
前言:最近Linux进程间通信视频课程很火爆,很多同学通过这个课程开始对Linux进程间通信原理有所了解,本文继续围绕Linux进程间通信这个主题,由浅入深讲解Linux进程间通信,让你彻底学懂Lin...
- c/c++ linux 进程间通信-----消息队列 (三步骤)
-
1.什么是消息队列消息队列提供了一种从一个进程向另一个进程发送一个数据块的方法。每个数据块都被认为含有一个类型,接收进程可以独立地接收含有不同类型的数据结构。个人理解:消息队列就是一个数据结构(也...
- Linux后台服务器开发——Linux下进程间通信的方式有哪些?
-
Linux下进程间通信的方式有:管道消息队列信号信号量共享存储套接字一、管道管道是半双工的,数据只能向一个方向流动;需要双方通信时,需要建立起两个管道PIPE无名管道...
- Nginx之进程间的通信机制(共享内存、原子操作)
-
1.概述详细教程资料+课件关注+后台私信;资料;两个字可以免费视频领取+文档+各大厂面试题资料内容包括:C/C++,Linux,golang,Nginx,ZeroMQ,MySQL,Redis,f...
- linux进程间通信—信号
-
Linux环境进程间通信(二)信号(下)一、信号生命周期从信号发送到信号处理函数的执行完毕对于一个完整的信号生命周期(从信号发送到相应的处理函数执行完毕)来说,可以分为三个重要的阶段,这三个阶段由四个...
- Linux进程间通信(一) - 管道
-
系列文章...
- Linux进程间通信(二) - 消息队列
-
系列文章...
- linux进程间通信——深入理解linux信号量
-
信号灯信号灯与其他进程间通信方式不大相同,它主要提供对进程间共享资源访问控制机制。相当于内存中的标志,进程可以根据它判定是否能够访问某些共享资源(临界区,类似于互斥锁),同时,进程也可以修改该标志。除...
- 六大进程通信机制总结
-
初学操作系统的时候,我就一直懵逼,为啥进程同步与互斥机制里有信号量机制,进程通信里又有信号量机制,然后你再看网络上的各种面试题汇总或者博客,你会发现很多都是千篇一律的进程通信机制有哪些?进程同步与互斥...
- Linux系统编程——进程间通信:消息队列
-
概述消息队列提供了一种在两个不相关的进程之间传递数据的简单高效的方法,其特点如下:消息队列可以实现消息的随机查询。消息不一定要以先进先出的次序读取,编程时可以按消息的类型读取。消息队列允许一个或多个进...
- linux下进程通信的几种方式
-
Linux上的进程如何相互通信?下图展示了进程间通信的5种方式。1.管道管道是单向字节流,它将一个进程的标准输出连接到另一个进程的标准输入。2.消息队列消息队列允许一个或多个进程写入消息,消息将由...
- 进程间通信
-
由于各个进程之间独享一块用户地址空间,一般而言这块独立的用户地址空间不能互相访问,所以进程之间想要通信必须通过内核空间(每个进程共享)。...
- 深刻理解 Linux 进程间七大通信(IPC)
-
前言网络编程是LinuxC/C++的面试重点,今天我就来聊一聊进程间通信的问题,文章末尾列出了参考资料,希望帮助到大家。...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle忘记用户名密码 (59)
- oracle11gr2安装教程 (55)
- mybatis调用oracle存储过程 (67)
- oracle spool的用法 (57)
- oracle asm 磁盘管理 (67)
- 前端 设计模式 (64)
- 前端面试vue (56)
- linux格式化 (55)
- linux图形界面 (62)
- linux文件压缩 (75)
- Linux设置权限 (53)
- linux服务器配置 (62)
- mysql安装linux (71)
- linux启动命令 (59)
- 查看linux磁盘 (72)
- linux用户组 (74)
- linux多线程 (70)
- linux设备驱动 (53)
- linux自启动 (59)
- linux网络命令 (55)
- linux传文件 (60)
- linux打包文件 (58)
- linux查看数据库 (61)
- linux获取ip (64)
- 关闭防火墙linux (53)