运维是一门艺术,也是一门苦差事,每位人对此均有不同的理解,正所谓一千个人眼里有一千个哈姆雷特。干一行就要爱一行,既然选择了这个行业,最好是能把它做到最好,发挥自己最大的价值。
分为以下四个方面:
同时也将分享一些具有参考意义的经验和技巧。
一、系统运维中网路方面的规划与思索
在好多公司,岗位职责都是很明晰的,专职转岗,每人或则每组负责一块业务。系统运维岗基本上在IT构架上相对偏后一些,该岗位和网路管理岗基本上是平行的。由于昨天俺们说的是系统运维方面网路方面的事情,或多或少就会和网路岗打交道,这么谈一点网路岗的内容就变得很有必要。
系统运维构建在网路的基础之上红帽设置ip,假如没有一个相对合理的网路构架,估计系统运维做上去也不是这么的顺手。一个公司基本上就会把网路和服务器独立开来,界定不同的区域摆放设备,好多时侯都是数学隔离。服务器接入交换机大多是经过配线架联接上去和有的服务器机柜头柜安装网路交换机,是相对比较常见的两种形式。
走线从侧面可以反映一个企业对IT的注重程度和投入,好多企业是做不到如图如此漂亮的疗效的。这一切一切还要立足于预算,如今基本上没有预算啥事也干不了。
大多数IT机房曾经构建的时侯,从设备混乱摆放到区域明晰界定储存,又从区域功能明晰到后来的后来的功能区域模糊,都反映了一个问题:计划赶不上变化。六年前还相当前卫的规划,到如今早已跟不上时代,这并不是谁的错,还是要求我们去适应去改变,业务推动改革,基础构架也需要做相应调整,所谓惟一不变的就是变。
我心里企业目前现阶段相对比较理想的构架这样的,如图所示:
这样一个传统企业典型的网路结构,保证每位核心节点都是双链路linux串口驱动,链路异常手动切换,各类切换在这些典型的网路结构上都或多或少的简单或复杂,不尽相同。网路方面关注几个点:稳定,安全,手动化。业务系统组件也尽量避开单点问题。
这样前端业务系统在联接网路层面稳定性就有了保障,在主机系统层面,尽量避开单独问题,去除性能困局,异常才能手动告警手动修补得相对比较完美红帽设置ip,其实这一切还要立足于预算。
二、系统运维中网路方面操作梳理
在系统运维中,常常涉及的网路方面的操作,通常由以下几个方面组成。
1.设备上线,化学连线设置
好多运维人员要从事从刚开始立项到项目上线再到后期运维的一条龙服务,每位环节都要自己亲自动手,这是好事也是坏事,好的是自己的环境通常会特别的熟悉,不好的是事必躬亲,不出活,业绩不显著。插个线都要自己来,你或许也没太多精力干其他的,这就是个矛盾体,自己掌握就好。
2.网路逻辑配置调整
这一块内容就涉及到了具体的操作,你可以手工一步一步操作,也可以利用高大上的工具批量完成,这个要看企业的IT建设的能力。一个网段一个点错误就会造成网路联接异常。假如自己有开发能力也可以使用脚本或语言写成成形的东西,平常多多积累,使用的时侯才会便捷好多。
具体内容涉及:
1)配置ip,别称,设置个端口窃听,绑定个网卡,设置个路由
2)界定个vlan,配置个trunk
3)测试个端口,配置个监控
具体的操作过程在此不做过多的介绍,例如做个网卡绑定啊,测试个端口啊,这种操作网上有大批的文档可以查阅,本节内容就是描述在日常的Linux系统运维方面所涉及网路方面的操作,有一个整体的印象。
3.性能剖析与优化
该部份内容相对不太容易操作,不是随随意都可以依葫芦画瓢才能完成,性能稳定剖析和定位相对困难一些,好多场景都须要结合多个方面进行统一剖析。这个须要一些工作经验的推论和沉淀,选择合适的工具,多方面配合常常会有比较好的疗效。
工欲善其事,必先利其器:
熟练把握该图里面的各类工具,基本上可以解决性能剖析99%的工作,那剩下的1%的不是bug就是天灾。这儿似乎在说笑了,但这也说明一个好的工具有多么的重要。剩余就是要仔细认真,再好的工具,不会用也不行,心态是第一位的。
三、系统运维过程中须要把握的神器
在上文中分享了一个图,该图囊括的面比较广,本节内容主要针对网路方面进行一些梳理,分享一下在工作当中常常使用的神器。
首先我们来分享一张目前Linux系统性能查看调优工具图:
这张图片基本上囊括了Linux系统各个方面的性能工具,可以说相当的全面,下边我们看一下有关网路方面我们常用的命令或工具有什么,这样有助于你们便捷查看和使用。
以上工具基本上在日常工作当中常常会使用到,每位工具都有其优缺,这儿列出的只是大量工具中的一小部份,由于每位人使用习惯不一样,各有注重arch linux,选择适宜自己就好,以上工具仅供参考。
本文内容意在梳理分享,不在具体的工具使用方面做愈发深入的讲解,由于每一个工具假如详尽讲上去就会涉及大量篇幅,也不可能面面俱到,有兴趣的可以在社区或搜索引擎搜索之。
推荐小工具:
Dig,ethtool,iperf,iftop,dstat,mtr
例如在你想晓得两个主机之间的带宽是否还能抵达相应的带宽,请使用iperf。想动态的查看目的地是否可到以及延后等信息,请使用mtr。
四、故障的确诊与剖析
故障确诊处理方面不是一两句话就可以说清楚的,很大程度上在于平常经验的积累,好多故障都是互相关联的,怎么顺藤摸瓜,找到问题的最终诱因,有一些方式可以借鉴。这儿不具体描述解决哪个问题用了哪些方式,只是说说解决问题有什么经验和方法。