浅谈主动运维意识在系统变更中的作用论文_刘炜桁

浅谈主动运维意识在系统变更中的作用论文_刘炜桁

刘炜桁

神华粤电珠海港煤炭码头有限责任公司 广东珠海 邮编:519050

摘要:随着业界对流媒体、IP化、超高清和5G技术的大力推动,新型视频监控架构既呼之欲出又难以一蹴而就,在技术变革的过渡阶段,相信很多港口都面临着系统架构选型和老旧系统维护的双重压力。无论是面对老化设备的故障频发,还是面对信息技术的广泛应用,保障正常运行是底线,而规范的运维无疑是坚守底线的最好措施。

关键词:变更;运维;服务;流程;文档;清单;技术债务;

一、摸清“系统脉络”

监控系统服务器老化严重,启动采购尚未到货,“屋漏偏逢连夜雨”,冷备监控系统服务器又因故障无法完全修复,重新采购已不可能。面对现状,运维人员需要梳理系统变更对全局的影响,摸清系统脉络,尽快调整、制定合理的变更方案。

1. 系统状态分析

监控系统服务器已在线运行9年,因主机和模块故障、系统不支持更新等问题,不能满足业务需求,更换新服务器是不二选择。

2.目前系统的缺陷

1) 操作性差。系统组成设备繁多,通过专属矩阵键盘才可以实现一些简单操作,而且中间设备过多,增加了故障点。

2) 扩展性差。矩阵、视频分配器、画面处理器已无多余端口,如需增加监控点位,就必须增加一套设备,安装调试及维护较为复杂,成本较高。

3) 管理性差。建立分控,往往是牵一发而动全身,除了需要增加另一套监控中心设备之外,新的设备也很难添加到原有的系统之中,还无法设置权限,导致无法合理管理,增加故障率。

4) 联动性差。无法形成有效的报警联动,在模拟监控系统中,由于各部分独立运作,相互之间的控制协议很难互通,联动只能在有限的范围内进行。

3.改造思路

前端摄像机并未达到报废年限,为了节约成本,采用模拟与数字相混合的数字化监控系统。混合数字监控系统的优势主要体现在投资适中、前端模拟摄像机便于维护和更换便利、前端摄像机不受网络带宽限制。总结以往的使用经验,室外采用IP摄像机时,受IP网络摄像机的网线传输链路的限制,需要在室外安装交换机。但是,受室外的环境、温湿度变化等自然条件影响,需要为交换机配置室外型箱体,极不便于管理维护。而采用模拟转数字监控技术,由于模拟视频信号传输距离和技术远远比网络传输便利,编码器及交换机等核心设备就可以放在环境较好的室内,提高了系统整体稳定性。

具体措施:前端摄像机保留现有的模拟摄像机,经由视频线连接到编码设备上,编码设备对模拟信号进行压缩处理后,实现网传、存储等功能。在监控中心采用综合管理软件,实现对各监控点多画面实时监控、录像、控制、报警处理和权限分配。部署在中心机房的网络存储设备采用集中存储模式,集中为监控中心和分控客户端提供资料检索与回放服务,显示控制子系统实现总控中心对全网视频统一调用、控制及显示,实现对模拟视频的远程访问、视频流接收、模拟视频的解码显示和大屏幕视频显示。以显示电子地图的形式,展示可用的视频资源;通过点击电子地图上视频标识的方式,查看该处的视频,以图形化的操作方式,实现了视频的统一调用及管理。

二、引入“项目管理”

我们将每一次系统变更都当成项目来运作,确保责任分工明确、过程节点可控、细节记录明晰。针对视频服务器更换调整,由技术部专门成立项目组,成员由技术部运维人员、中标服务器技术支持人员和相关使用部门专业人员构成。组织形式为平衡矩阵结构,此种形式能把职能原则与对象原则相结合,既发挥使用部门的纵向优势,又发挥项目组织的横向优势。

期刊文章分类查询,尽在期刊图书馆

在系统变更全过程中,由信息科长统一调度指挥,并随时向部门领导请示汇报,依据实际情况随时调整修改施工计划,合理控制项目进度,最大限度避免风险的发生。运维技术成员技术思路清晰,熟悉合作交付管理模式,所有参与人员各司其责、相互配合。

通过引入项目管理:

变更决策更有依据,避免决策的随意性和盲目性,有效控制变更范围。

合理安排变更进度,有效使用设备资源,确保变更按期完成。

加强项目团队合作意识,提高运维人员的服务质量。

降低变更风险,提高在线施工的成功率。

三、遵循“科学流程”

科学流程可有效约束运维管理行为,提高运维管理质量和效率。ITSS(Information Technology Service Standards,国家信息技术服务标准)就定义了事件管理、问题管理、变更管理、发布管理、配置管理、知识库管理等运维流程。变更管理条目中明确了“运维服务实施主体应建立变更管理流程,通过控制和管理信息系统的重要变更,使其对生产环境造成的影响和风险降到最小,从而提高信息系统环境的整体稳定性”。我们遵循的变更流程大致为:需求确认→干系业务/人确定→方案探讨→方案确立&时间确立→变更单撰写→变更单审查→审批报备→变更通告→方案实施→方案效果反馈(→回滚方案)。流程执行中也会根据实际情况不断优化调整。

以“确认上下游干系业务”为例,运维人员做了如下工作:

生产部及本部门相关操作使用人员,现场收集业务需求,理清各部门用户权限。

向以上部门和科室通告操作说明,介绍系统变更对日常工作的影响,并公示项目负责人联系方式。文字力图简练,摒除晦涩的技术术语,方便业务人员理解。

在项目施工前后,多次向本部门操作使用人员集中讲解值班注意事项,素材同步流程以及应急操作步骤。

事实证明,这些遵循变更流程的工作,有效提升了运维服务质量,具体表现为:

风险可控或规避。方案是多次论证探讨后确定的,时间是相关部门共同协商后认可的,流程是经过审批报备的,结果也已知会所有使用人员,过程风险降至最低。

变更有序。避免了运维人员依赖自身技术各自为战、人为失误较多的情况;运维有条不紊,既增强运维人员的自信心,也增加使用部门的信任感。

满意度高。运维人员与使用部门建立良好、顺畅的沟通,用同理心对待业务流程的痛点,协同工作,迅速解决问题,运维满意度自然上升。

四、坚持“编写文档”

文档编写是运维标准化和流程化的要求,也可为运维自动化做铺垫。技术文档种类繁多,我们在系统变更前期编写需求文档、设计文档和实施计划;在变更中期,依据前期的文档优化部署,详细记录每天的施工内容;变更完成后,则改写操作规范、运维手册和应急预案等,并修正系统图纸。这些工作对运维人员的文档编写能力、绘图工具使用能力和统筹协调能力又是一种考验。

系统变更过程中加强文档编写,既能取得知识传递、经验传承的作用,又能减少交流成本,提高运维团队工作效率。在这些技术文档里,我们特别青睐操作清单。比如,确定了视频服务器在凌晨集中调整,运维人员必定会提前一天写好操作流程清单,思考每一处风险点及相关应急预案,力争把变更产生意外的概率降到最低。

清单不是大而全的操作手册,而是理性选择后的思维工具。清单可以帮助运维人员把事件条理化,提醒每个“关键步骤”的因子,在决策的时候不要跳过“关键步骤”,激活记忆,集中注意力。我们还对“关键步骤”坚持双人复核的原则,杜绝操作失误。在日常工作中,通过梳理、总结、提炼各种场景下的关键原则和关键操作,我们就可编写许多运维清单,再经过严格执行获得检验、反馈和完善,直至形成“最佳运维实践”清单——应急预案。

结语

改造后的系统,不仅可以满足视频录像事后取证的功能,最为重要的是有一定的预警功能。根据预警信息,采用适当措施,把事态控制在萌芽状态,可减少意外事故的发生。视频监控系统中心平台能实现对系统资源的集中统一管理,分级授权使用。监控中心出现任何故障时,不应影响整体系统的正常使用。

参考文献

[1]SMG信息系统运维体系建设实践与探索上海广播电视台虞蔚菁赵健林嗣雄柴为民《电视工程》2018年第4期

论文作者:刘炜桁

论文发表刊物:《科技新时代》2019年11期

论文发表时间:2020/1/8

标签:;  ;  ;  ;  ;  ;  ;  ;  

浅谈主动运维意识在系统变更中的作用论文_刘炜桁
下载Doc文档

猜你喜欢