|
发表于 2025-8-6 03:53:22| 字数 9,717| - 中国–北京–北京 电信
|
显示全部楼层
|阅读模式
本帖最后由 hljgyr 于 2025-8-6 17:22 编辑
本帖为经典移动CPU架构纵测系列第三篇,前两篇已发至新区并更新内容至25年7月,坐标在此:
多核部分:https://www.ibmnb.com/thread-2032370-1-1.html
单核部分:https://www.ibmnb.com/thread-2032848-1-1.html
前言
51nb经典区一直是坛子最有含金量、最硬核的存在,即便后来经典区新区分了家,仍旧有相当多的大神在经典区养老,贡献了大量干货帖子,个人在这些年间也受益良多。因此本篇特在cpu主题下发表,算是为老区添砖加瓦以表敬意,也方便坛友查阅对比
经典区围绕怀旧机型的体验和测试帖一直是人气最旺的,精彩论战不断,诞生了多个名帖,多年来为坛子增添了不少快活的空气。究其原因,论及各代机器的实际性能对比,一方面仅凭几组跑分数字(比如国际象棋、cpuz)便对机器性能下定论必然难以服众,另一方面对机器应用性能的评价很容易参杂客观干扰因素或是情怀加成,加之各人对速度的感知度不一,结论也可能与实际情况大相径庭。
和之前对不同架构cpu能效曲线进行测试的动机相同,开展纵测的目的在于让跨越时空的机型同台亮相,公平竞技。而这一次将抛开冰冷枯燥的跑分数据,只谈日用体验,通过量化可比的体验让坛友了解到十多年来我们手边的笔记本cpu性能到底走过了什么样的进化历程。
年迈的酷睿2(x61/t400)老家伙在2025年还堪用吗,极限超频后日常应用能战赢最新笔记本吗?
三代(x230/t430)经典机型作为坛内人气王,历经十多年岁月,日常办公能否依旧得心应手?
八代机型(x390/x1c 2018)作为当年分区的分水岭,数年后的今天是否还能代表先进生产力,和最新机器相比会慢多少?
E核心日常应用性能是否真如网上宣传的那么不堪,AMD Zen是否真如自媒体评测那样在“生产力”领域一路碾压intel?
本篇将一一揭晓~~~~
一.测试平台及设置
在测试软硬件平台选择上,主要依据以下原则:
1.选择同世代CPU高端或次高端型号,发挥同架构移动cpu最大性能潜力,避免测试因核心频率或处理器规格(缓存大小、核心数量、内存支持)不足导致数据代表性受影响;
2.代数选择上,由于6-10代、12-14代核心架构几乎未改变,仅在制造工艺、核心规模、内存支持方面优化,因此仅以同架构全规格cpu做测试供参考,zen系列同理;
3.测试平台均组建双通道内存,选用系统支持最大频率下的标准规格内存(DDR3-1066~1866/DDR4-3200/DDR5-5600),不对内存做单独超频或时序调整;
4.对于SATA接口硬盘早期机型,为减小硬盘性能瓶颈可能产生的影响,均选用双固态盘并开启raid0模式;
5.上述平台均默认安装win10 2004版本纯净系统,并关闭windows自动更新、windows defender等功能,测试时非必要保持断网。对于部分新硬件由于核心调度或兼容性原因若在win10上测试结果明显异常,则考虑用win11 24H2版本系统下测试成绩替代
测试机型如下
酷睿系列:
core2: thinkpad w700/QX9300/8g ddr3-1066/fx3700m
1代:thinkpad w701ds/i7-940XM/24g ddr3-1333/fx2800m
2,3代:m18xr2/i7-2960XM、3920XM/16g ddr3-1866/gtx 680m
4代:precision M6800/i7-4940MX/32g ddr3-1866/quadro p4000
10代:sparsea S210H/i9-10980HK/64g ddr4-3200/uhd630
11代:nuc-x15/i7-11800H/64g ddr4-3200/rtx3070m
13代:ks16s/i9-13900HX/64g ddr5-5600/rtx4080m
15代(Ultra2xx): ys16u/U9-275HX/64g ddr5-5600/rtx5070Ti-m
ZEN系列:
zen2:um480xt/r7-4800H/32g ddr4-3200/vega7
zen3:um690pro/r9-6900HX/32g ddr5-5600/680m
zen4:um790pro/r9-7940HS/32g ddr5-5600/780m
zen4HX:r9000p 2024/r9-7945HX/32g ddr5-5600/rtx4060m
zen5HX:cl16u /r9-9955HX/64g ddr5-5600/rtx5070Ti-m
ATOM系列:
atom-apl:teclast x3/n3450/6g ddr3-1600/hd500
atom-jsl: pn41/n6005/16g ddr4-3200/uhd-32eu
atom-gcm:eq12pro/i3-n305/32g ddr5-4800/uhd-32eu
所有测试项目均采用秒表手动计时,如系统自动记录测试时间则采用系统计时,各处理器均在2、2.4、3、3.6、4、4.4、5、5.4GHz频率下(以cpu实际支持频率向下兼容)进行测试,每项测试两遍并取最短用时,时间偏差超过5%则增补一次测试并排除波动项,直至测试数据稳定。
补充说明,测试涉及所有行业软件仅用于cpu测试用途。
二.应用响应及办公生产力测试
这里先引用知名评测媒体tomshardware对单核性能的描述,直接给google译文:
“单线程性能通常与您的 PC 在日常各种应用中的响应速度和流畅度直接相关,例如加载操作系统或浏览网页。该指标很大程度上取决于每周期指令 (IPC) 吞吐量(芯片在一个时钟周期内可以执行的操作数)和频率(即晶体管在开启和关闭状态之间切换的速度)。然而,许多其他因素,例如缓存、架构和互连都会影响每核性能的衡量标准,因此这些结果并非完全基于时钟频率,性能会因每个应用程序及其针对相应架构的调优程度而有所不同。”
由于本人非计算机或软件专业,只浅谈下对当前系统响应和单核性能的个人理解。
打个不是非常恰当的比方,把cpu当成一家饭店,里面的核心是店里的厨子,按照一般逻辑,厨子越多出菜越快,但顾客要是点一道菜的话,16位厨师一起上不会比一个厨师快多少,因为人再多,也需要同样的功夫准备这份餐,而且里面的工序不能乱否则味儿必然不对,厨师动作麻利些(频率更高)那就更快做好。要是摆两桌席,那16个人就能摊开各自去备菜,但是也难免会碰到灶台炊具不够用的时候。一般用户比如大多数坛友,平常需求基本就属于点个外卖或是下个馆子,正常顾客绝不会因为这家店大就要求必须把菜一分钟内做好。
回到日常使用场景,系统的响应耗时,主要在执行加载或运算指令上,而现在绝大多数日常一般应用软件均未支持上述指令的并行化,不管是因为任务执行逻辑无法并行还是任务无法匹配核心进行拆分,单个程序所能调用的核心还是处在1-2个范围内,这也是当年intel i7敢放心维持4c规格长达近10年的内在原因。一般用户对速度的感知,在cpu计算资源(核心及内存)充足的情况下,基本是当前操作的响应程度体现,也就是和单核心速度高度相关的。
至于生产力,按照释义,是实际进行生产活动的能力,也是劳动产出的能力。而目前的情形是,绝大部分内外网的cpu评测在涉及到"生产力”场景时,一致选取诸如blender的渲染性能代表生产力,专业些的评测会采用SPECworkstation、PugetBench软件,但上述评测工具依旧面临下面几个问题:
第一,媒体渲染生产力能否代表实际办公性能和程序响应速度?
第二,和显卡性能高度绑定的生产力(PugetBench测试)能否代表依赖CPU的生产力?
第三,和核心数量高度绑定的生产力(SPECworkstation测试)能否代表重度依赖单核的一般生产力程序?
这里并不意图去质疑评测媒体和评测软件的专业性,而是数码评测媒体在跨领域后很难准确找到其他行业专业用户对cpu性能的痛点,因此只能寻找相对泛用的工具进行评估。
正因为如此,本次测评目的是从真实的生产力场景出发,在泛用测试工具之外提供更偏向实际应用的处理器对比结果。
测试项选取上,结合本人在能源设计行业数年的经验,选择了11个测试项目,他们的共同性在于:
1.典型的cpu单核负载,执行速度和单核性能高度相关;
2.核心敏感型负载,硬盘吞吐性能、显示性能不影响执行速度;
3.测试软件版本稳定,不因强制更新影响数据对比;
4.测试项目对系统配置要求相对友好,从早期酷睿2到最新处理器均有效兼容;
这些测试项目用时长短,基本上对应着点击鼠标后可摸鱼时间的多少,速度快了,摸鱼时间减少,生产力也直接提升(对牛马来说未必算好消息)。
显然,单一专业领域远不能覆盖所有的专业生产力场景,因此这一套测试,坛友可以结合各测试项的内容,对应其在各自领域内的类似场景并评估其可参考性。
下面是具体测试项介绍,以及各架构cpu在锁定4GHz频率后的运行时长,以W700(qx9300)运行情况为例:
1.选用PDF软件ABBYY,禁用背景识别,读取示例文档后选择识别文档并计时至完成。识别功能是专业PDF软件的基础功能,通过OCR使图片格式文档具备文字可编辑性(此测试调用2个核心参与工作)。
2.选用WAsP 10风资源评估软件加载示例工程,以150m精度(63000个网格)绘制风能图谱,计时至计算窗口关闭。
3.选用地理信息系统软件Globalmapper14,加载wasp软件生成的网格图谱,计时至加载完成,此项单独考察CPU对数据集的加载速度。加载后的图谱可以执行坐标参数化和后续一系列地理信息格式转换操作。
4.选用Civil3d软件环境下的山地光伏自动布置软件Helios3D2016,加载demo文件,执行优化布置功能,步长0.1m(迭代79次),计时至显示布置后结束。
5.选用光资源评估软件PVsyst7.1,加载demo文件,以1°为步长执行光伏组件倾角-能量仿真过程,计时至计算窗口关闭。
6.选用EXCEL2019打开示例大型表格文件,显示加载界面开始计时,计时至显示表格时结束(不含后续表格计算时间)
7.选用PS CC2018对示例图片集进行批量镜头矫正滤镜操作,计时至进程结束
8.选用风资源数据处理程序Windographer4加载并处理数据表,计时至显示数据通道界面。
9.选用地理信息系统软件ArcGis2.8加载地理信息数据图斑,并将分类筛选后数据转换至通用可识别kml格式,采用系统记录转换时长。
10.选用NRG传感仪器数据记录系统,检验并合并加载数据集(497个记录文件),计时至任务完成。
11.选用CAD2023,对示例工程文件全部元素执行块分解指令,计时至任务完成。
为评估上述测试项综合性能,将11项测试中各项按10代处理器4GHz下运算时间=100秒归一化处理并做算术平均,其意义是某集合上述全部测试子项的综合任务需10代处理器在4GHz频率下运算100秒完成。
下图将展示4GHz频率下各架构综合任务执行时间时长,由于4GHz对早期处理器需深度超频达到,而对新处理器仅为默认频率水平,因此考虑处理器运行频率随工艺迭代的提升情况,结合各测试项在处理器各频率点下的测试数据,分别按频率推算至主流序列(i5级别)、高端系列(i7/i9)典型单核工作频率,另绘制各代主流CPU产品应用响应时间所在区间。
以定频测试结果绘制以酷睿2为基准的各代处理器应用性能IPC及逐代提升情况:
对比单核测试篇根据理论单核测试计算各代IPC及提升情况:
下面是总结时间,部分结论可能与大众认知相差较大,仅代表个人日常应用及专业领域测试情况,坛友辩证看待:
1.时至今日,对于大多数非数据流及非高并行需求的一般行业领域,目前依旧是单核速度决定系统响应速度和程序运行速度,单核心IPC和单核性能仍是计算机综合性能的基础组成部分。
2.就处理器日常应用速度看,有下列粗略的等效关系: 4GHz十代 = 6.67GHz酷睿2 = 5.9GHz一代 = 5.3GHz二代 = 4.9GHz三代 = 4.4GHz四代
4GHz十代 = 3.4GHz11代 = 3GHz13代 = 2.65GHz15代 = 3.9GHz13代E = 3.1GHz15代E
4GHz十代 = 5GHz ZEN2 = 3.7GHz ZEN3 = 3.3GHz ZEN4 = 3GHz ZEN5
3.处理器应用响应速度和单核理论性能整体是极高相关性的,根据全部测试处理器各频率段散点数据,IA两家各自系列cpu相关性系数R2均在0.99以上(横轴为相对X9100-3.06GHz的应用性能百分比倍数,纵轴为相对X9100-3.06GHz的单核理论综合测试百分比倍数)。
4.对Intel来说,仅从代际IPC增长看,1代、Ultra2代显示出显著强于理论幅度的应用性能提升,1代(12.5%,理论4.5%)是基于核心重构,处理器及内存带宽大幅提升而来;而Ultra2代(14%,理论7.8%)目前暂未从带宽、延迟、内存方面找到合理解释,但它在部分测试项(数据导入相关)中有突破性的速度提升,很可能是LNC架构对应的计算单元有明显的加宽,而这种加宽在当前主流的跑分软件中无法对应呈现。
10代(10.4%,理论9.7%)、13代(12.5%,理论13%)对于前一节点架构属于常规提升,对比理论单核性能提升的话,2代(13.8%,理论22.6%)、4代(11.3%,理论17.1%)、11代(16.8%,理论22.3%)则低于理论预期,他们的共同点在于在上代基础上扩展了指令集,而指令集对特定程序才能有相应加成,对系统响应速度的提升则帮助不大。
但考虑提升幅度,上述处理器代际直接提升其实还是明显的,10代相比2代,提升了接近37%的同频程序速度,加之频率提升,一颗5GHz频率10代i7基本具备双倍2代3.2GHz频率i5的实际应用速度。
5.鉴于大量经典行业软件及工具组件程序目前仍基于x86框架编写,而传统x86单核性能与新指令关联度低,其结果就是AMD处理器在行业领域存在先天不足(x86测试软件跑分和应用性能显著低于Intel),与其说是Intel对传统应用优化更好,不如说AMD为了弯道超车精简了对应计算模块,IPC提升重心放在了新指令集上。
比如根据本次测试集,基于ZEN2架构的4800H,单核理论同频性能强于10代,而在单核综合应用性能上同频仅与3代IVB相当,部分测试项甚至仅微弱领先于同频酷睿2,使用过ZEN2处理器的坛友,可以回忆下设备程序运行是否有跑分宣传中那么强大丝滑,尤其是与同期10代高端机型对比。
ZEN3在上代基础上则是有了接近30%幅度的全面升级,应用程序IPC追上并小幅领先10代,这意味着在20年末至21年初这一短暂时期内,AMD首次对Intel有了实质性的应用性能领先,但考虑10代u疯狂的单核睿频后,整体还算是旗鼓相当的局面。严格来说ZEN3系列是AMD真正翻身的代表作。
ZEN4在性能方面属于常规升级但幅度依然可观,应用程序响应方面达到并略微超越了11代,但最亮眼的其实是高频段同频能效的提升。
ZEN5从架构层面对浮点模块大幅加宽,确实对单核跑分,尤其是渲染类测试提升很大。但可明显感知的提升仅限于此,回到系统响应和单核应用性能,综合比起上代则仅有9%的提升,与13代P核心勉强一致。加之Ultra2代高于预期的提升,两者差距来到了接近15%。是除了10代对ZEN2以外差距最大的世代。
非常有意思的是,ZEN5可以说是AMD口碑最高的一代,反观Ultra2几乎被全部媒体疯狂批判为倒吸,甚至出现了“R5战全家”的暴论,把用1080p显示器配90系显卡的高贵的竞技游戏玩家的使用体验生搬硬套到办公和非并行生产力领域,影响着占多数采购量的日常用户的认知,是一个耐人寻味的现象。
6.谈及Intel的低功耗Atom系列,从12代GCM架构过后,其特性从单纯的低功耗转化为高性能密度,即利用同样面积的晶圆做出最大性能的核心集群。在这种策略指向下,Atom核心的适用性及实用性真正迎来了飞跃。早期Atom核心由于功能模块缺失、外围性能欠缺,程序响应速度极慢,生产力应用性能基本等同于无(N3450和X301上的U9400相当),即使考虑到功耗低,用户心态上也无法接受一颗处理器应用程序IPC仅相当于10年前机型8成不到的存在。
转折点发生17年底发布的JasperLake架构上,尽管高频能效不尽人意,但单核IPC终于超越了酷睿2水平,加上高频DDR4内存支持,3.3Ghz的N6005(测试集综合用时162s)已经领先4GHzQX9300约3%,真正达到了日常可用的水准。
而后续的Gracemont核心迎来了大幅度突破(41.6%),在13900HX上应用程序绑定E核后执行速度已经超越10代,接近ZEN3架构核心,即使下放到N100/N305一类的低功耗平台,双通道内存下其应用程序IPC仅损失约8%,达到10代同频率下的95%。
至于最新的Skymont核心则继续维持着迅猛的增幅(25.8%),以275HX为例,其E核应用程序IPC已经无限接近13代P核及ZEN5核心,这里我邀请手中有Ultra2代机的坛友做一项实验,在Windows中通过调整隐藏电源选项设置中的异类线程调度策略/异类短运行线程调度策略,将程序优先分配至E核心,然后使用一段时间去观测系统速度是否有可感知的下降。
“凑数”、“跑分专用”、“电阻丝”,E核这些年承受了太多的骂名,也一直在以自己的节奏默默迭代着,正如当年的ZEN系列核心。量变引起质变,以类似的提升幅度,仅需两代左右,E核便能和P核并驾齐驱,或许是Intel早预见了这个结果吧,两三年后它的架构终将迎来统一,未来是否如预期所言我们可以拭目以待。
7.以2025年最新处理器为标准,个人认为达到其日常程序运行速度的75%(测试集综合用时68s以内),一般情况下不会被轻易感知,可以认为属于主流性能级别,11-13代、ZEN4-ZEN5、Ultra2代E核均在此级别内;
达到其日常程序运行速度的50%(用时102s以内),属于仍可胜任日常使用的一般性能级别。在此要求下,8-10代机、ZEN3、13代E核均属于级别;
对于养老型选手,达到其三分之一性能(用时153s以内)也认为勉强可用的话,2代机器基本就是可接受的性能下限了;
至于更古早的机器,以t9900为例,仅有新处理器日常程序运行速度的25%不到(用时210s),四打一也难求一胜,极限超到4.26GHz后勉强有三分之一性能(用时156s),放到现在连2GHz的E核都能轻松碾压(用时152s)。多的我也懒得说,懂的都懂,数据就摆在这里,拎着象棋和CPUZ几个破数几年如一日去招摇撞骗,就算扯脖子喊破天也改变不了任何现实。
三.多线程应用测试
多线程测试主要关注于日常应用中典型的多核负载场景。分为压缩、视频编码、文件识别转换、网页加载,共5项。
由于涉及多核负载的专业软件及行业软件,如CFD计算、程序编译、专业渲染等,一方面对系统性能尤其是内存要求极高,低配置平台无法运行,同时移动平台因内存扩展受限无法充分释放多核心系统性能,因此现阶段暂无法提供基于行业生产力的多核应用性能测试结论,可结合上述几项日常应用场景作参考。
1.文件压缩,选用7zip2202程序采用默认设置对Cinebench r20、r23程序文件进行压缩,记录文件生成时间。
2、3.视频转码,分别选用Handbrake1.5、ShanaEncoder5.3对2段示例高码率4k视频转格式,采用系统日志记录时间。其中ShanaEncoder软件本人曾单独发帖讨论其性能话题。
4.网页加载,选用Chrome加载一包含13个网页的页面集,记录CPU满负荷时间,统计5次并加和。
5.文件识别转换,选用ABBYY加载一PDF文件并转为可编辑WORD格式,记录CPU满负荷时间。
同样地,为评估上述测试项综合性能,将5项测试中各项按10代处理器4C8T规格4GHz频率下处理时间=100秒归一化处理并做算术平均,其意义是某集合上述全部测试子项的综合任务需10代4核心8线程处理器在4GHz频率下运算100秒完成。
下图将展示3GHz频率下各架构综合任务执行时间时长,同样考虑处理器运行频率随工艺迭代的提升情况,结合各测试项在处理器各频率点下的测试数据,分别按频率推算至主流序列(入门4核级别)、高端系列(全规格i7/i9)典型多核工作频率,另绘制各代主流CPU产品应用响应时间所在区间。
由于多核性能IPC和处理器核心数绑定,因此为方便比较,以4C规模为例通过3GHz定频测试结果绘制以2代为基准的各代intel处理器多核应用性能IPC百分比(浅色条)及逐代提升情况。可以看到应用性能提升显著的代数为酷睿2-1代(规格提升)、1代-2代、4代-10代、11-13代,巧合的是上述提升均与内存规格的提升相关联,可见多核性能提升对内存带宽存在一定依赖性。
关于多线程应用的总结:
1.在多线程应用方面,目前AMD的HX系列仍在一般功耗释放区间(55W-100W)占据一定优势,但是差异随功耗的提升逐渐缩小。近两年两家的全规格HX处理器,在满功耗的情况下,日常应用性能并无可感知差异。
2.与ZEN2在单核应用方面的弱势截然不同,ZEN2在更多依赖媒体数据流的多核应用性能上表现良好,和10代处在同一水平。类似地,ZEN3-11代、ZEN4-13代(p核)也拥有基本相当的多核应用性能;Ultra2代由于P核取消了超线程,其性能有一定幅度的缩减,缺失的性能部分更多由E核弥补。
3.13代的E核心集群在多核应用性能上仅与8核ZEN3处理器基本相当,而到了Ultra2代,其性能直奔默认55W的前代全规格HX处理器。对比N100的多核应用性能,采用SKM架构的下一代N系列低功耗处理器,在4核3GHz下会拥有与相同频率3代IVB相当的多核应用性能,在8核2.4GHz下拥有与3.7GHz10代低压满血的多核应用性能,再结合断层领先的单核应用性能和预计15W以内的功耗,基本可以从操作体验上将10代以前机型彻底淘汰。
4.对于经典机型来说,与单核的形势不同,近些年CPU工艺的进化完全体现在了频率和规格的提升上,尤其是后者。尽管核心不断倍增后其性能的边际效应越发严重,但规格上的碾压早已成为新旧处理器多核应用性能方面无法逾越的鸿沟。作为最强酷睿2的代表,QX9300即使超频至3.6GHz,多核应用速度也只能达到当今最强u的10%不到,更何况当年的主流双核。即使以相对现代的8代4核标压对比,也仅有其三分之一的性能。
5.对于一般用户来说,2.4GHz的十代4核心处理器配合显卡硬解,已经可以通吃95%以上的日常应用。这里附上本人对早期双核、四核处理器日常应用进行的主观性评测中的处理器占用和操作流畅性记录,具体可见W700超频评测贴。即使是多核应用性能相对更差的4代cpu,在3GHz频率下同样支持以40fps左右的稳定帧率运行1080p高画质下的黑神话、2077、地平线5等3A游戏。因此处理器多核性能焦虑其实是伪命题,重度多核性能需求往往脱离绝大多数运行时间内的日常使用场景,按需所取依然是选择cpu的黄金法则。
补充一下,3GHz的4代属于淘汰品没错,但依旧有QX9300全核超频3.73GHz后两倍以上的应用性能。至于某人手上的酷睿2双核,不好意思,你连跑Cinebench和3dmark的能耐都没有,你更没本事刷我在HWBOT上面的酷睿2处理器最大性能分,你在我眼里连一根都不是。石砸狗叫,你点的每一个反对都是我让你破防的勋章。
写在最后
在应用部分测试整理完成后,处理器纵测工作基本算是告一段落,6年来不间断的设备、精力投入,时至今日终于呈现于此,感慨颇深。
希望同坛友一道分享这份成果,也借此祝论坛经典区生生不息,成为怀旧玩家们最温暖的长久归宿。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?注册
x
评分
-
查看全部评分
|