2015-09-21 09:30:00
如何做好大型数据中心的运维?
大型数据中心往往是由很多规模庞大的集群系统组成,其运维工作需要具备方方面面的知识,包括硬件、网络、服务器、存储、安全以及业务上的东西,需要上下打通地去做运维工作 <详情>
2015-09-18 15:10:46
数据中心故障大多因保密而不为人知
近年来,数据中心故障屡屡发生,其中包括在新加坡证券交易所电力中断事件,虽然这个事件是个例外,新加坡证券交易所还是公布了这个消息。但其他数据中心运营商的数据中心发 <详情>
2015-09-18 09:56:14
什么才是真正的容灾与备份?
容灾和备份经常放在一起讲,但实际上是两个概念,容灾是为了在遭遇灾害时保证信息系统正常运行,帮助企业实现业务连续性的目标;备份是为了应对灾难来临时造成的数据丢失问 <详情>
2015-09-15 11:59:30
构建高效IT运维体系的三个步骤
IT运维成本管理是指在保障企业信息化系统与业务正常、安全、有效运行的基础上,通过规范IT运维体系提高IT运维效率,从而达到降低IT运维成本的目的。低成本、高效率的IT运维 <详情>
2015-09-14 13:39:12
标识管理:数据中心内不可忽略的大问题
机房的标识管理是信息系统标准化建设的一个重要环节,标识管理要从实际应用出发,参考国际、国内或者行业标准的要求,解决在机房什么位置上、用什么样材料和颜色的标签,最 <详情>
2015-09-09 10:32:24
运维窍门:四种方法加快您的专用服务器
如果你的专用服务器仅仅是一台计算机,但却不能够满足要求,这个时候你也许并不需要更换一台更好的服务器,你只需要按照下面的五个提示,也许就能够让你的服务器更快。 <详情>
2015-09-07 11:26:12
别用重启的方式来维护服务器
我今天要谈论的是,服务器运维,当你的电脑运行缓慢、卡顿等情况出现时,你是否习惯性的采用重启的方式呢?这种方式是否可行呢? <详情>
2015-09-07 10:00:51
防止数据中心宕机的集成系统测试(IST)
实施IST的想法是有道理的,但不是每个人都尽他们可能去做。比较IST做备份或灾难恢复(DR)。每个人都进行备份并采取快照,但究竟有多少企业能够实际测试这些备份呢? <详情>
2015-09-01 11:33:00
干货分享:360网络运维的最佳实践
2007年,360公司的服务器数量是1000台,经过不同阶段的发展,现在已经达到了10万台服务器的规模。本文按照公司服务器发展的不同阶段,分享在网络建设和运维过程中遇到的哪 <详情>
2015-08-28 09:38:48
Future Facilities公司推出数据中心散热模拟工具
日前,Future Facilities公司推出了6SigmaDCX,这是一款为非专业人士开发的计算数据中心生命的各个阶段的流体动力学(CFC)工具,让数据中心更为高效。 <详情>
2015-08-26 11:45:12
Verizon选用Mesosphere管理数据中心
Verizon选择Mesosphere初创公司的数据中心操作系统自动化管理数据中心,这是佐证大型电信运营商采用Web2.0领域流行技术的又一经典范例。 <详情>
2015-08-26 10:38:45
机房环境湿度过高怎么办?
,机房湿度一旦超标就很容易在元件或电介质材料表面形成水膜,以致造成"导电小路"和出现飞弧,会严重降低电路可靠性;而有些塑料及橡胶产品,由于吸水,会产生变形甚至损坏 <详情>
2015-08-26 10:18:29
数据中心的税收优惠并不万能
如今,美国各州正在为数据中心运营商提供廉价的电力和税收优惠,以争夺其数据中心业务。但是这些诱人的优惠政策是不是过于慷慨了? <详情>
2015-08-25 10:54:23
高逼格运维指南:Google SRE是如何工作的?
SRE是Site Reliability Engineer的简称,从名字可以看出Google的SRE不只是做Operation方面的工作,更多是保障整个Google服务的稳定性。SRE不接触底层硬件如服务器,这也是 <详情>
2015-08-18 09:56:00
老外整理的运维技能大全: Devops Tools周期表
老外整理的 Devops Tools 周期表,可以用酷炫屌炸天形容,划分了数据库、CI、日志、安全、监控、配置管理、云服务等15个大类,120个工具。我是有点孤陋寡闻,很多都没听说 <详情>
2015-08-17 09:26:49
运维标准化文档的四项基本原则
笔者希望通过这篇文章能向各位传达一个观点,企业运维的标准化其实很简单。不用追求大而全,从自己的最佳实践出发,统一化规范化以后,会发现运维的工作突然清晰了很多。 <详情>
2015-08-16 18:27:00
监控管理软件降低数据中心运行故障
实际上,绝大部分数据中心都无法做到常年业务不中断,但是尽可能地减少故障,确保其运行过程中随时监控管理,预、告警任何错误故障,不放过任何相似的问题,将风险降至最低 <详情>
2015-08-14 09:53:00
谷歌高效管理的秘密:OKR考核
本文章内容主要节选自黄哲铿的新书《技术管理之巅—如何从零打造高质效互联网技术团队》。本文是其中第二篇,主要讨论OKR及其与KPI的区别等,希望大家喜爱。 <详情>
2015-08-12 11:08:00
规模大又如何?盘点互联网巨头的云服务故障
世界上没有十全十美的事,即使底层技术再怎么好,托管提供商再多么能干,苹果、三星、CloudFlare、亚马逊、微软这些牛气的互联网巨头也曾犯下严重的云服务故障。 <详情>
2015-08-10 09:28:00
助力运维人员职业上升的法宝
运维要带着耻辱感工作,才能让运维的价值凸显出来!运维人要把这些耻辱感记在心里,如此才能不断的想去如何改变运维的不足。 <详情>
2015-08-07 09:49:21
运维自动化的最佳实践探索
这些年来,经历了不同形态的业务和不同规模的运维,今天我主要和大家分享我这些年来关于运维自动化的一些认识和实践。 <详情>
2015-08-05 15:21:56
对数据中心基础架构DCIM工具有何期待?
统一集中化管理平台对于数据中心的设备和管理人员来说,是不是必须的?应该选择哪种DCIM产品? <详情>
2015-08-05 15:08:00
具备哪些素质的人才能成为运维人员?
运维管理是需要人去做的,如何才能管理好一个数据中心,才能充分发挥数据中心的作用,使之能更好地为云计算提供强大的支持能力。运维人员应具备什么样的素质才能做到这一点 <详情>
2015-08-04 10:05:10
彭博社数据中心应对灾难的故事
2012年在美国肆虐的飓风桑迪,对彭博社的曼哈顿数据中心并不是一种弹性测试,而彭博社数据中心业务经理约翰•奥康纳却想再经历一次。由于风暴潮来袭,2012年10月下旬纽约市 <详情>
2015-08-03 10:27:00
运维外包与自主运维,谁更靠谱?
不同企业的IT运维模式差别较大,这往往和企业信息化建设的模式有关。例如企业自建系统一般都会采用自己运维的模式,采用外购模式的企业往往需要产品或解决方案提供商来协助 <详情>
2015-08-01 11:39:36
能源及DCIM导致数据中心支出持续攀升
在过去两年的调查中,计划在即将到来的下一季度中增加数据中心支出的受访者的比例分别为27%和24%。这些支出开销将主要集中在机架和布线、电源设备和数据中心基础设施管理(D <详情>
2015-07-29 12:40:00
如何签署数据中心租赁协议?
数据中心租赁协议的定义就是IT企业签署了可能是清晰明确的或者难以理解的法律文件,来租赁可以利用的数据中心设施。“租赁协议是管辖关系的主要法律文件,”ThompsonCoburn <详情>
2015-07-27 10:23:00
最大限度降低数据中心内部工作风险
众所周知,数据中心工作的安全风险很小,但这也值得数据中心管理者努力去减少风险,安全永远是第一要义。除了火灾和泄漏,数据中心更大的危险是触电,因此保护员工安全的最 <详情>
2015-07-27 09:53:32
迎接互联网+时代 企业IT运维也需变革
随着互联网+时代的来临,各行各业的创新方法与规则都在变化,然而对于企业的IT运维则似乎缺乏了变化的动力,诸如事件管理、故障管理、自动巡检等技术似乎同物联网、虚拟化 <详情>
2015-07-27 09:25:52
腾讯IDC海量运营资产管理实践
腾讯拥有海量IDC资产的互联网企业,其中服务器、网络设备等IDC运营资产的数量巨大,资产种类繁多,仅服务器就有几十个品牌,几百种型号,同时在日常运营中对于资产的应用需 <详情>
2015-07-23 10:20:00
高可用架构的Uber容错设计与多机房容灾方案
在7月21号的全球架构师峰会深圳站上,美国科技公司Uber的高级工程师赵磊做了主题演讲“Uber高可用消息系统构建”,本文分享了分布式系统中的各种错误处理的方案。 <详情>
2015-07-22 10:41:00
高效运维最佳实践七字诀
我们那么努力,为什么总感觉过得那么憋屈、苦闷?做的事情那么多,为什么业务部门、直接领导和公司貌似都那么不领情?怎么做才能自己更加开心些?结合各种失败与成功、痛苦 <详情>
2015-07-21 10:20:00
细数IT行业的关键绩效指标KPI
KPI将成为考核IT服务绩效的一个重要因素。KPI包括与业务需求结合的度量,数据中心的监测和能力规划等等指标。 <详情>
2015-07-20 09:44:00
多灾多难!盘点2015上半年IT宕机事件
2015已过半,在这半年内,全球共发生了多少起宕机事件,已无法统计,但是,我们仍然希望举出我们所熟知的例子,来"以史为鉴"。 <详情>
2015-07-20 09:24:37
新加坡证券交易所数据中心电源中断的启示和教训
2014年11月5日,新加坡证券交易所(SGX)业务系统中止了将近三个小时,因其数据中心无法应付由雷击引起的电压波动而停电宕机。据当时的报道,5日下午2点18分,断电事故致使 <详情>
2015-07-17 09:50:12
数据中心远程运维及主要实现方式
随着手机,平台板移动设备的推出,IT运维工作是否可以通过远程来进行维护呢?今天我们就来谈一谈IT运维人员在远程运维的那些事。 <详情>
2015-07-16 10:17:00
扼杀数据中心效率的七宗罪
前不久的一项研究发现,超过30%的数据中心服务器处于长期闲置或休眠状态。本文介绍的这七大因素导致贵企业的数据中心效率低下。 <详情>