当前位置:首页 > 生活 > 正文

IT运维必知的六大原则

10-12 生活

IT运维必知的六大原则

众所周知,故障是运维人员永远的痛!我们怎么避免故障,下面简单列举了以下几条,与大家共勉!

1

//

1.变更要有回滚,在同样的环境测试过

所有的变更都必须有回滚的办法,在同样的环境下测试过。没有做过的东西,总是会在你意想不到的地方给你一次痛击,多年运维经验告诉我们,所有没有做过的变更,出错的概率最大。所以我们需要给变更以回滚的可能,在各个步骤可能出错的情况下,考虑回滚到最初状态。优秀的运维人员对不考虑回滚的的操作都是敬而远之的。从某种意义上来说,运维是一门经验的学科,是一门试错的学科。

2

//

2.对破坏性的操作谨慎小心

破坏性的操作有哪些列?对数据库来说有:DROP Table, Drop database, truncate table, delete all data;这些操作做完了以后几乎无法考虑怎么把数据都回滚回去了。就算回滚,代价也是非常大的。你执行这样的语句非常简单,但是回滚恢复数据缺非常困难。这些操作时就要更加谨慎了。

3

//

3.设置好命令提示

让你时刻知道你在操作哪个数据库,让你知道你在哪个目录下。开多个标签页的话,如果每个标签页的标题上内容一样,我们切来切去就有可能在错误的标签页上做操作,设置了这个以后,这个问题概率就会小很多。

4

//

4.备份并验证备份有效性。

是人总会出错,是机器总可能会有突然崩溃的那一天,怎么办?我们需要准备备份。备份有了,是否就可以高枕无忧了?还是不行。你需要验证备份的有效性。没有一个备份能够保证它备份出来的数据能够100%恢复出正确的数据。所以,备份并不只是备份,它还包括备份的验证,它如果不能恢复出正确的数据,就只是浪费空间而已。

5

//

5.交接和休假最容易出故障,变更请谨慎

这个是经验之谈。我们在总结故障的情况时,发现在公司部门有变化时,工作交接,故障的出现频率会比正常情况下多50%以上。公司或者部门难免会做一些调整,变化是世界上唯一不变的事情。所以,运维部门和运维人员对变化需要尽量放平心态;接手别人的工作要一而再,再而三的确认变更方案。请教人并不见得就是能力不行的表现;休假前最好各种可以做好的事情,最好能够准备一份文档,指明在什么情况下怎么做和联系哪些人。在别人放假的时候接手工作,“能拖则拖”,实在需要执行:必须不厌其烦的跟原运维者确认各个操作细节。