第三方系统能耗分析

咱们聊聊这个关于第三方系统能耗分析的事儿。现在这年代,企业都很在意省不省电,尤其是数据中心这种大户人家。咱们搞了个实验,就是想看看这些系统到底咋用电的,顺便给后面的优化找点靠谱的数据。这次的测试范围主要是放在数据中心机柜里的那个业务系统,里面啥都有,有服务器集群、数据库、交换机还有存储设备,能自己干活儿的一个大单元。为了摸清底细,我们把这系统在平常干活儿和干重活儿两种状态下都测了一遍。 具体看了啥?主要就是这几个点:第一个看这系统一共吃了多少电;第二个看它是不是一会儿吃得多一会儿吃得少;第三个算算跑了多久一共用了多少电;第四个看看对电网的利用怎么样;第五个算出一个单位业务要花多少电;最后还得摸摸设备烫不烫手。为了数据准,咱们用了直接测的办法还有模拟压力的办法一块搞。先是把系统开了30分钟热热身,让它在没活儿的时候先稳住功耗。接着就用那个压力测试的工具把用户访问量一点点往上加,加到顶为止。每个阶段都得稳稳当当撑过60分钟。然后用FLUKE1735这种高精度的功率分析仪一直盯着电压电流和功率,每1秒就采样一次。不光盯着电表,还得把CPU利用率、吞吐量这些数据也记下来,好把性能和耗电联系起来。等到压力最大的时候,再拿FLIRE8这种热成像仪给设备来个全身扫描,找找有没有发烫的地方。 用了啥家伙事儿?有FLUKE1735这种高精度的三相或单相功率分析仪、高性能的压力测试服务器和软件、FLIRE8的热成像仪、还有一个带数据记录的系统和温湿度计。 通过这么一通测下来的数据看,系统在正常工作时的能效比有多少多少事务数/千瓦时。能耗和干活儿的量可不是简单的直线关系,在负载跑到50%到80%的时候它最划算。不过也发现有些服务器在压力最大的时候身上有热点了,以后优化得特别盯着这点儿。 这实验给后续的优化和制冷配置都提供了依据。建议大家多关注轻负载时吃电的比例,或者试试虚拟化或者动态管理电的策略来提高效率。 咱们这次参考的标准可不少,像GB/T30246.1-2013、ASHRAE Standard 90.4-2016、Green Grid指标还有IEEE Std 2410-2020这些都有在里面。 通过上面的分析和建议,希望能给大伙儿在管电这事上多添个心眼儿。