Search the whole station

案例解读 | 某电子电路基材上市企业监控+网管平台建设实践

PART 01
项目背景
01客户简介

案例客户是一家大型电子电路基材供应商,拥有员工达1万多人,其某类型板材生产及销量位居世界前列。

02痛点分析

经了解,客户存在以下运维痛点:

  • 没有专业的运维团队,运维职责划分边界不清晰;
  • 运维流程尚不完善,缺乏规范化运维管理标准;
  • 无统一运维管理系统支撑与自动化支持,运维工作完全靠人工进行;
  • 未建立完善的业务监控,业务发生问题要等用户反馈;
  • 基础设施监控配套不完善,发生问题时无法关联相关的业务系统;
  • 网络资源多样,环境复杂,网络故障定位与排障困难;
  • 告警覆盖不全面,告警信息不明确,相关告警难关联,告警信息冗余失去关注重点。

PART 02
p333金沙贵宾会方案

p333金沙贵宾会为该客户规划了一站式智能监控+网管平台,对运维管理流程体系进行重构,提升信息系统监控能力、网络管理能力以及运维人员工作效率。

方案架构

监控能力

在监控能力上,搭建统一智能监控平台整体框架,提供从IT基础硬件设施、服务器、操作系统、网络设备、链路、虚拟化、中间件、存储、数据库到业务可用性拨测的一站式故障预警监控、性能指标管理平台。

监控能力为系统维护人员提供针对IT基础资源的故障发现、故障定位、故障报警、响应规范、权责体系,变传统的被动应答故障处理方式为前瞻式监测的管理方式,具体如下:
01统一运维,集中管理

实现对IT基础资源的集中监控和管理,保障业务系统稳定的良性循环。

02监控告警全覆盖

通过统一告警流程机制+分派升级机制,无人认领升级到二线,不遗漏重要告警。

03构建业务视角

从业务视角对云资源进行管理;搭建业务与云资源的关系模型,快速定位故障影响范围。

04可视化管理

建立所有视图统一管理平台,包括业务拓扑、运维驾驶舱、投屏视图等各类视图功能。

网管能力

在网络管理能力上,搭建智能网管平台,提供网络拓扑、专线链路监控、IP管理、流量分析等核心功能。

01网络拓扑

自动发现在网设备资源,自动生成拓扑关系图,直观展示各网络节点关系,帮助运维人员快速发现网络故障节点及其影响范围。

02IP管理

IP管理以视图的形式直观显现各网段的主机的分配及在线情况,并且进行分配和回收;同时支持快速查看IP状态、Mac地址、接入设备及端口信息,结合流量分析,判断网络流量情况。借助IP管理,客户实现对多网段IP的有效管理,当网络堵塞时快速找出占用流量较多的IP。

03专线链路监控

专线链路监控支持Rping探测、Proxy代理监控,实时掌握专线负载及通断情况。

帮助客户全面监测与掌控多个厂区和办公地点的专线网络,对专线负载(端口带宽使用率、时延等)和专线通断了如指掌。

04自动发现

面向客户的网络系统,网管平台支持自动发现多品牌的网络设备、服务器、存储并生成网络拓扑图,以及物理链路拓扑,支持监控链路、网元、带宽速率等信息,帮助客户解决混合组网、网络隔离、端口链路流量等问题。

05专业流量分析

流量分析可识别占用最多流量的IP、应用程序和协议;

支持探测历史 IP 流对话,粒度可精细至一分钟;

可分析 Cisco-NetFlow、NBAR、Juniper- J-Flow IPFIX、sFlow、Huawei-NetStream及其他流数据。

PART 03
客户收益

1. 打破数据孤岛:有效整合各个数据模块实现从监控、告警、处理、维护,以及其他运维服务数据无障碍流转

2. 一体化管理:整合各个系统的登录、跳转、用户、权限、资产,从而实现运维工作一体化办理

3. 全栈式监控:集合应用性能、网络性能、基础设备全栈式集中监控,全方位保证业务正常运转

4. 异常关联分析:基于运维数据的全面整合,对于异常可从应用层、网络层、物理层,多维度关联分析,精准定位异常原因

5. 统一展示:通过关联不同监控来源的资产信息、监控信息、服务管理信息,实时展示数据分析结果

p333金沙贵宾会社区已经开放p333金沙贵宾会监控免费版和p333金沙贵宾会MCM(监控+CMDB)免费版,欢迎下载体验

The prev: The next:

Related recommendations

Expand more!
XML 地图