IT 核心系统管理服务
系统 24 * 7 主动式实时监控
  
我们会以轮班的方式为甲方的机房提供 24 * 7 主动和持续性的系统监控。最大限度预防意外停机事件。此项服务将确保系统的可用性,同时对潜在问题预先发出警示。
  监控内容
  (一)机房环境
  a.通过 UPS 厂商提供的工具进行机房内 UPS 输入电压电流、输出电压电流、负载使用情况、电池使用情况、电源网络、报警系统的监控。
  b.通过恒温恒湿设备厂商提供的工具对机房温度和湿度进行监控。
  c.当监控到 UPS 或恒温恒湿设备运行指标超出指定的正常运行阀值时,向设备维护商请求维修。
  (二)网络可用性
  a.通过查看网络设备日志、专业工具对客户的网络设备运行状态和线路连通性进行实施监控。包括:
  • INTERNET 连通性
  • 业务主干网络
  • 核心交换机
  • 核心路由器
  • 汇聚层交换设备
  • 防火墙
  b.利用专业工具对网络带宽和流量、防火墙日志和连接数、网络设备日志进行实施分析。当有异常发生时,我们首先会向客户通报问题的情况,随后将独立或与其他有关的服务提供商一起协作来共同解决问题。
  (三)主机可用性
  a.利用专业工具对客户的 UNIX 主机及 WINDOWS 主机系统服务和应用服务的可用行进行实时监控。
  b.对主机文件系统和逻辑磁盘的使用状态进行监控。
  c.对主机的系统日志进行分析。
  d.对备份日志进行检查。
  e.对主机系统性能检查。包括:
  • CPU 性能
  • 内存使用情况
  • 检查 IO 平衡使用情况
  • 交换空间使用情况
  (四)存储可用性
  通过查看存储系统日志、存储设备报警灯对存储设备进行监控。包括:
  • 磁盘阵列
  • 存储设备
  • NAS 存储设备
  • 磁带库和磁带机
  • 执行应急计划
   当机房出现异常停电或突发灾害事件时,将按照机房应急计划执行紧急关机和恢复。
系统故障隔离与解决
  
(一)不论是监测到的系统事件,还是客户提出的系统问题, 我们都将及时起用事件管理流程有效地解决问题。首先会向客户通报问题的情况,随后将独立或与其他有关的服务提供商一起协作来共同解决问题。
  (二)此项服务包括:
  • 网络设备(核心交换机和路由器、汇聚层交换设备、防火墙)故障的诊断和修复。
  • 主干网络线路故障的诊断和修复。
  • UNIX 主机和 WINDOWS 主机设备故障以及和操作系统相关的故障诊断和修复。
  • 存储设备(磁盘阵列、存储设备、 NAS 存储、磁带库和磁带机)故障以及和操作系统相关的故障诊断和修复。
  • 邮件系统和 DNS 服务器的应用和设备故障诊断和修复。
  • 其他应用系统的故障诊断和修复。
  (三)如果设备配件存在故障,需要更换时,对于保内设备,联系厂商进行及时的更换。