
开篇案例:一辆跑车的极限
你买了一辆跑车,想知道它性能怎么样?
你会看 马力(horsepower);
你会看 加速度(百公里加速);
你会看 油耗(效率)。
同样的道理,算力中心的性能,也必须有一套标准来衡量。否则,你怎么知道这座“数字发电厂”能支撑多少AI应用?
今天我们就来拆解:算力的单位到底有哪些?

一、FLOPS:算力的“马力”
最经典的算力单位是 FLOPS(Floating Point Operations Per Second,每秒浮点运算次数)。
1 GFLOPS = 每秒 10⁹ 次浮点运算
1 TFLOPS = 每秒 10¹² 次
1 PFLOPS = 每秒 10¹⁵ 次
1 EFLOPS = 每秒 10¹⁸ 次
比如:
一张 NVIDIA A100 显卡,单精度算力约 19.5 TFLOPS;
中国“神威·太湖之光”超级计算机,峰值算力约 125 PFlops;
未来全球正在冲击 E级超算(Exascale,百亿亿次)。
FLOPS = 跑车的 马力,越大代表跑得更快。
二、TOPS:AI算力的专属指标
AI模型训练和推理不光需要 FLOPS,还需要专门的 TOPS(Tera Operations Per Second,每秒万亿次定点运算)。
GPU/TPU/NPU 在 AI 场景中更倾向用 整数运算(INT8、INT16) 来加速。
因此,TOPS 更贴近 AI 实际算力。
举例:
一颗华为昇腾 910 AI 芯片,算力可达 256 TFLOPS(FP16) / 512 TOPS(INT8)。
一颗高通骁龙移动NPU,可能就标称 45 TOPS。
TOPS = 跑车的 加速能力,衡量 AI 算得快不快。

三、QPS:互联网算力的“流量表”
如果 FLOPS 是科研用的指标,TOPS 是 AI 的指标,那么 QPS(Queries Per Second,每秒查询数) 更接地气,常用于互联网。
搜索引擎、数据库、推荐系统,最关注每秒能响应多少请求。
比如百度搜索、淘宝秒杀活动,后台 QPS 都要支撑百万甚至千万级。
QPS = 跑车的 高速路通行能力,决定能不能同时拉这么多人。
四、PUE:能效才是“生死线”
光有算力还不够,算力中心还要讲究 能效。
这就要看 PUE(Power Usage Effectiveness,电源使用效率):
公式:PUE = 数据中心总能耗 ÷ IT设备能耗
理论最优值是 1.0,即所有电力都用于计算,没有浪费。
现实情况:
传统机房:PUE = 2.0(50%电白白耗在制冷上)
优秀算力中心:PUE < 1.3(液冷、绿色能源加持)
PUE = 跑车的 油耗,再强的马力,如果油耗惊人,也跑不远。
五、综合算力指数:为什么没有唯一单位?
很多人问:能不能用一个单位概括算力?答案是——很难。
因为不同应用场景关注点不一样:
科研仿真:看 FLOPS
AI 训练:看 TOPS
互联网服务:看 QPS
政策指标:常用“综合算力指数”,结合算力规模、能效、应用需求来综合评价。
所以,算力的衡量,就像评价一辆车:马力、加速度、油耗、通行能力——缺一不可。
六、结尾升华
算力的单位,不是冷冰冰的数字,而是未来社会的度量衡。
它决定一台 GPU 的价值;
它决定一座算力中心的级别;
它决定一个国家的数字竞争力。
如果说 算力中心是发电厂,那么这些算力单位,就是它的 电表与性能表。
下一讲,我们将走进算力的计算逻辑:一座算力中心的算力,究竟是怎么算出来的?