您的当前位置:首页正文

业务系统硬件设备搬迁方案

来源:独旅网
业务系统硬件设备搬迁方案

一、 搬迁原因

甲方通知我方:业务系统部署位置由某区管委会8F机房,搬迁至行政服务中心机房。

二、 搬迁时间

搬迁起始时间:2021年4月18日09:00

搬迁时限:48小时(周末进行)内搬迁并调试完毕

三、 搬迁前准备工作

3.1搬迁设备信息

机柜1 设备名称 抗DDOS网关 漏洞扫描系统 数据库审计系统 日志审计服务器 一窗服务器1 一窗服务器2 一窗服务器3 一窗服务器4 存储服务器

机柜2 IP地址 设备名称 Web应用防火墙 自安全交换机 信息化服务器1 信息化服务器2 信息化服务器3 信息化服务器4 信息化服务器5 IP地址 3.2搬迁前后机柜图

3.3搬迁注意事项:

总的原则:先关掉所有的服务器,关掉安全设备等用电设备,然后关掉总的电源,最后才进行服务器的拆卸。

➢ 全面预防静电

虽然服务器是靠电力工作的,但静电却会给服务器带来致命伤害,尤其是可能对主板芯片造成永久性损坏。静电产生的原因很多:各种电源设备可能产生静电,这就要求我们要特别小心静电的干扰,全面预防。

1.尽量使服务器及其周边设备的接地良好。

2.如果设备没有接地,当我们要接触里面的板卡时,应先用接地导线或其他放电设施对其进行放电。

3.对设备进行操作时,应配戴防静电手套,如果没有的话,也可以用手触摸一下机箱外部的金属来放掉自身携带的静电。

➢ 电缆连接(插拔)

电缆在进行电缆连接(插拔)时,通过该电缆连接(或将要连接)的设备应当是没有加电的,即应当先将设备的电源关掉,然后再进行电缆连接(插拔)操作。否则,如果带电进行电缆连接,有可能会对设备造成无法预料的损坏。

网络及安全设备主要包括交换机、抗DDOS、WAF等设备,这些设备在搬迁过程中注意标记,并且在接入新网后根据新网的结构进行正确的参数设置。这里需要注意的是,路由器使用带有接地的电源。一般要求使用的电源的零地间 的电压<4V,零火/地火的电压就为220V。地线保护基本上要求上网的设备需有保护地线。

对于一台已经配置好的服务器来说,它的关闭和打开操作很简单,但如果操作方法不当,有可能对设备造成不必要的损坏。因此,有必要对服务器的开机、关机做一详细介绍。

关机操作:1.关闭操作系统;2.关闭主机电源;3.关闭外设电源 (如磁盘阵列,磁带库等);4.关闭其他设备电源和机柜电源;5.关闭总电源。

开机操作:1.打开总电源;2.打开计算机机柜电源;3.打开外部设备电源(如磁盘阵列,磁带库等);4.待外部设备自检完成后,最后打开主机电源。

➢ 搬迁设备标签

我们的目标是:掌握原有的网络情况,力求要做到每一条物理,逻辑的线缆,专线都心中有数,所有网络设备的配置,每个接口都要一清二楚,所有设备,线缆都要贴标签,所有接口的配置,说明都要有文字上的说明。在给设备做标签时,一般是采用贴设备铭牌的方式,线缆采用专用的标识环。

关于设备标签的规划,一般是各单位自己制定,没有统一的标准,这里我们可以考虑,按设备的类型、功能、区域等进行编号。每台机器搬之前都要贴好标签,特别是多端口的机器,每个接线端口都贴上标签,与接线的另一端相对应,比如storage的盘柜与controller的连线端口,storage与server的光纤的连接端口等,还有每台server的每个网卡的ip等。

最后,对设备标识完成后,注意做好标识的备份工作,以备设备重装时核查。

所有标示,做到一一对应,保证在搬迁过程中能够准确的找到某一台机器设备,保证搬迁的顺利进行。

➢ 设备拆除、打包和运输

在对设备进行统一的标记后,进行设备的拆除、电缆的拆除。这里我们需要注意的是:

确保所有的工作都在断电的情况下进行;

考虑各部件的拆卸步骤;

严格按照各类设备的规范来拆除。

设备拆除后,装入专门的搬迁保护装置,如:电缆放入线槽进行保护。之后在各个责任人的共同监视下装上车,大家共同看护下,将设备运往新大厦的机房。由于我们搬运的设备,如服务器,UPS,终端等都是集成度和精密度非常高的设备,因而在整个过程中,需要注意防止设备的碰撞。

1设备的拆卸

工程师按照项目进度表的时间来确定设备的拆卸时间,严格遵守规范化操作,保证设备没有物理性的损坏。

操作步骤:

(1)把连接设备的数据线和电源线拔掉,从机柜上拆卸下来,所有的电源线放置在统一的包装箱中,在包装箱上写上货物的名称,并打包封后待运。

(2)把设备从机柜上拆卸下来,进行除尘工作后,放到指定的包装箱中,在包装箱的外壳上写上货物的名称,并打包封箱后待运。

(3)把设备的导轨从机架上拆卸下来,并贴上标签,注明使用的设备的名称,放到指定的包装箱中,在包装箱上标明货物的名称,并打包封箱后待运。

(4)把PDU从机柜上拆卸下来,放到指定的包装箱中,在包装箱的外壳上写上货物名称,并打包封箱后待运。

(5)所有的螺丝等辅助设备分类分包,放在其关联设备的包装箱中保存待运。

2 运输过程

使用专业的设备运输包装箱,确保硬件设备在运输过程中的安全性。包装要求按照工业标准。并附有货物清单,由指定人员进行验收,签字确认。

(1)装箱用手推车运送到运输车辆处,由专业的搬运工小心轻放到运输车上,整齐摆放,固定,以防滑落。

(2)有押运人清点货物后,押运到新的办公地点。

(3)运输车在运输的过程中,一定要注意车辆慢行,以防在道路颠簸的情况下损坏设备。

(4)卸货时由专业的搬运工把货物先卸到货梯门口,然后由押运人清点货物全部到场后,由专业的搬运工把货物搬至指定位置。押运人再次清点无误后准备安装。

3设备重新安装

物理安装

设备搬运到新的机房后,首先确定设备的放置位置,检查电源等相关事宜是否做好,最后,进行物理连接。

这里需要注意:

区域规划。在设备安装时,最好按网络拓扑结构进行区域的规划,并为以后的扩展保留空间和相关接口。

对机柜进行有效的固定。机柜不能是直接摆放在静电地板上,而要进行有效的固定,这样安装才可靠。

工程师按照安装方案,把包装箱打开,根据安装方案把服务器上机架。严格遵守规范化操作,把服务器安装到指定位子。

(1)安装PDU:安装工程师首先安装PDU,按照安装方案要求,把PDU固定到机柜上的指定位置。

(2)安装导轨:安装工程师把服务器的导轨安装到机柜上的指定位置,以便服务器上机柜。

(3)安装服务器:安装工程师把服务器安装到机柜上的指定位置。

(4)安装电源线:用电源线把服务器于PDU连接,把电源线捆绑在配线架上。

(5)安装SWICH:把SWICH固定在机柜上的指定位置。

(6)连接数据线:连接SWICH到服务器,连接网络线。

设备加电系统核查

设备物理连接完成后,为设备加电,测试电源电压,进行加电后系统的软硬件检查。

四、 搬迁流程

4.1搬迁基本流程

1:业务系统数据备份、安全设备策略备份,截至时间: 2:业务主机关闭系统,截至时间:

3:业务主机及安全设备关闭电源,截至时间: 4:业务主机及安全设备下架; 5:搬迁设备至新机房;

6:设备上架至新机房指定机柜位置;

7:设备加电开机; 8:测试系统及业务访问。

4.2搬迁流程示意图

业务系统数据备份/安全设备策略备份业务主机关闭系统业务主机关闭电源设备上架至新机房指定机柜位置搬迁设备至新机房业务主机及安全设备下架设备加电开机测试系统及业务访问

五、 应急预案

5.1应急小组信息

搬迁应急小组成员 技术人员 联系方式 应急内容 “信息化”业务系统应急小组成员信息 技术人员 联系方式 应急内容 “一窗式”业务系统应急小组成员信息 技术人员 联系方式 应急内容 5.2应急恢复方案

5.2.1设备拆装恢复方案

重新安装设备过程中常见故障的应急方法:

5.2.1.1服务器类:

1、 硬盘故障

在设备移动过程中,常见的硬盘故障是硬盘松动问题,由于服务器做了raid5,因此当硬盘出现故障亮红灯时,应当直接拔除故障硬盘。首先假设是硬盘松脱,参照下述的raid问题,重新插入硬盘恢复raid级别即可。如果确认不是硬盘松脱而是硬件故障,应向甲方报备,建议尽快采购新硬盘,防止在拔掉一块硬盘的情况下,再出现其他硬盘损坏,导致raid损坏,数据丢失等等。

2、 内存故障

设备移动过程中,导致的内存松动等问题,可以在关机状态下,通过重新拔插内存条来恢复使用。大部分情况下不是内存的物理损坏,只是逻辑或者系统出现故障的情况,我们把故障内存和旁边的内存交换一下,故障大部分情况就会消失。如果最终故障内存还是无法使用,我们可以拔掉与该

内存相对应配合的内存,达到服务器正常运行的条件。相对应的服务器也就损失的内存量,降低了性能。怎样找到内存的对应配合关系?这个在背板上有说明,一般情况下1/4、9/12、2/5、8/11、3/6、7/10这样的规律成对配合。

3、 电源故障

本次所搬迁服务器都是双电源,正常搬迁过程中,如果其中一个电源故障,则单电源首先确保业务恢复运行,并向甲方报备,之后打设备厂家售后电话进行产品保修(一窗式服务器过保)。如果是双电源故障,则向甲方报备,看是否临时部署在停用服务器上(一窗式搬迁含3台停用服务器),并及时报修服务器。等原服务器故障恢复,再恢复业务至原服务器。

4、 Raid问题

1、硬盘松脱导致的raid降级问题,可以在开机过程中输入CTRL+R,进raid界面,配置松脱盘符状态,并修复raid。

2、如果硬盘损坏,只需要拔掉故障盘,插入全新硬盘,系统会重做raid。 3、如果最终raid恢复不成功,出现需要重做raid的情况,只能通过搬迁前的备份文件及数据进行业务重建。

上述服务器故障,除了一窗式宝德工程师周日提供技术支持外,现场会有华为工程师跟进处理业务服务器故障。

5.2.1.2安全设备类故障:

安全设备共五台,其中WAF和抗DDOS设备支持bypass功能,如果设备接入发生硬件故障,则设备直通,不会中断业务访问。另外的漏扫系统、日志审计、数据库审计系统是旁路部署,在硬件故障情况下,不会中断业务访问。如果上述安全设备出现任何故障,奇安信技术会在现场提供技术支撑。

5.2.2业务恢复应急方案

5.2.2.1概述

本次涉及到服务器前后某信息中心分配服务器6台,具体服务器信息如下:

服务器名称 信息化服务器1 信息化服务器2 信息化服务器3 信息化服务器4 信息化服务器5 一窗服务器3 服务器IP 服务器应用部署情况 前置服务器 业务服务器 交换前置 接口代理 统一用户管理 业务服务器 5.2.2.2准备工作及应用恢复

准备工作

① 明确业务服务器应用部署情况;

② 搬迁前,做好应用程序、数据库全库备份;copy到移动硬盘或远端服务器上。 ③ 服务器关停前,提前关停应用以及数据库。

应用恢复

① 服务器开启后,启动数据库以及应用; ② 测试验证应用是否正常。

5.2.2.3应急预案

应用恢复出现故障,无法正常使用,紧急处理如下: ①及时协调高级技术工程师配合排查处理,并反馈部门经理; ②若故障未能及时解决,则重新导入数据库,并重新部署应用。

因篇幅问题不能全部显示,请点此查看更多更全内容