找回密码
 注册
快捷导航
查看: 11388|回复: 62

[CPU] 【原创】狡猾的intel,分析32nm core i 的性能瓶颈QPI和内存延迟问题和显卡性能。

[复制链接] |自动提醒
阅读字号:

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
发表于 2010-8-12 21:07:17| 字数 2,445| - 瑞典 | 显示全部楼层 |阅读模式
看到很多弟兄抱怨笔记本内存性能差,说比以前的p8700还慢。或者说换了新机器,感觉不到性能提升,其实这是intel的又一个策略。

QPI是intel的新一代总线,并首先应用于nehalem作为cpu和北桥x58(包括Pci-e)的连接以及多cpu系统。后来lynnfield北桥被整合到cpu内部,pci-e也被同时整合。intel考虑到北桥(包括pci-e)已经整合到内部,对于现在的cpu和PCH(传统的南桥)通信,不需要太高的带宽,所以精简了设计继续用传统的DMI(数字多媒体界面)来连接,带宽依旧是2.5GTs,不多,但是对于应付网卡,硬盘的IO是非常的足够了。什么情况会不足够呢?可以这么说,大约10块ssd raid的时候就不够了。

看看主角的结构


32nm时代


到了32nm的I3时代,也就是Clarkdale,笔记本是Arrandale。intel由于考虑到市场需要,把好不容易整合在一起的北桥又拆开了,称为MCP(多核心封装),其中cpu用32nm HKMG工艺,北桥用45nm HKMG工艺,中间用QPI连接。为什么称那个45nm的东东叫北桥呢,因为他和传统意义的北桥并无太大差距,他包括了内存控制器,显卡,PCI-e。不同之处是和cpu连接使用了QPI连接而不再是传统老旧的FSB。但是在评测得分上,i3的内存性能并不突出,延迟还出奇的高,看似非常强悍的QPI,结果性能相比旧的FSB提升只有一点点,难道又是intel的一个玩笑?

分析QPI产生的瓶颈问题,QPI在i3上的任务非常的重,它承担了所有与cpu数据通信的任务,无论内存,显卡还是南桥的IO设备。笔记本i3的QPI是被降级的4.8GTs,台式机可以通过BCLK(外频,比如133mhz)超频来达到QPI的提升,比如超到200mhz的时候,QPI是刚好6.4GTs。解释一下,何谓4.8GTs,4.8GTs就是传统的4800Mhz,QPI带宽的计算是4800 x 16(20位带宽有效16bit)x2(双向)/8=19.2GBs。看上去非常的大,相比于以往的FSB,提升了一倍不止,略高于双通道ddr3 1066(17.2GBs)提供的带宽。但是由于QPI设计是分单双向传输的,也就是说,单向传输最大只有9.6GBs。最大带宽19.2GBs是指上行下行同时达到峰值9.6GBs的状况。这样的设计能减少等待延迟,可以做到相应更及时,减少堵塞现象。相比FSB是很大的进步,以前的FSB传输是需要等待的,一旦被占用,则需要等待空闲时机,上行下行不能同时发生。虽然进步很大,但是QPI的带宽依旧不足以满足内存交换以及其他应用的要求,所以QPI作为FSB对性能影响非常巨大,尤其是延迟。

双向的QPI


测量跑分问题


测试软件的问题,传统的测试软件,是基于FSB原理来测试的,比如一次上行,一次下行,从而测出带宽,但是对于i3这种QPI可以同时上下行进行的则没有任何提升。所以内存测试比如everest测出来的是单向的带宽,而不是双向的带宽。这一说法anandatech也证实了。原文“The bandwidth figures are not stellar on either side of the scale (bear in mind the Everest bench DLL needs an update for Clarkdale). ”所以笔记本用i3,双通道内存带宽也就是7600MBs左右。符合单向9.6GBs带宽利用率。至于内存延迟,由于采用新的QPI总线,导致了延迟的上升。

后藤说“原文 ●等待时间与带宽间保持平衡

  这样的类似性并不是偶然的。从目前情况来看,CPU最适合的内部连接应该是嵌入式时钟方式。由于嵌入式时钟存在overhead和等待的时间。因此嵌入式时钟解码为“8b/10b”,这样每个时钟循环就是损失5~25%的数据。另外就是EmbeddedClockEfficiency电路会变大。同时控制器需要对数据进行解码和编码,这样对于CPU来说就是等待时间。而这也是为什么Intel仍然在使用FSB的原因,主要是因为FSB等待时间短。”


使用QPI做FSB连接,会导致等待时间上升,所以这就是为什么延迟比原来GM45高了几十个纳秒。

i7的法宝之一

最后关于内存控制器,为什么i7 lynnfield nehlaem内存性能会这么强悍,因为i7的内存控制器被移入cpu内部,和L3直接相连,并没用通过QPI,所以延迟可以做得非常的低。
关于i7带宽:因为内存没有经过QPI,所以没有涉及单双向问题,可以推测,i7的片内总线(一直没有公开,有推测是256bit的环形bus)非常的强大,带宽延迟足以满足内存要求。而且内存交换数据无需经过QPI,也不用和其他资源竞争总线。

总结:鉴于笔记本arrandale问题的特殊性,要提升性能,只能开启双通道,一定程度的缓解单通道内存IO带来的瓶颈,尤其是显卡。不要过分相信跑分软件,部分软件没有对qpi特性进行优化。intel很狡猾,估计内存延迟和带宽问题要通过Sandybridge才能解决了,但是新的结构,gpu和L3共享,这样就极有可能严重影响L3的性能。还有Intel是否会在片内使用QPI总线,就像Atom内部用FSB一样也是一个不清楚的问题。假如Intel仅仅是把位置再次移动而不做本质(使用高速片内总线而非内部QPI)改变的话,就会重犯arrnadale上的内存性能的错误。也许是intel故意为之的,为了让45nm库存清空。因为内存性能要是做到和i7一样,那样i3的性能将至少再有10%-20%的提升,会极大的影响45nm的库存。一方面是预留sandybridge的提升空间。

以上是小弟的一些看法。如有不对,请指正。

QPI的物理特性具体请参考http://server.it168.com/a2009/0206/264/000000264646.shtml




[ Edited by  dothan228 on 2010-8-13 01:02 ]

评分

参与人数 2技术分 0 资产值 0 收起 理由
HOPE 0 -20 精品文章
htttg + 20 我很赞同

查看全部评分

abcdefg

2万

回帖

211

积分

2973

资产值

至尊会员II Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2009-6-9
发表于 2010-8-12 21:14:30| 字数 7| - 广东省深圳市宝安区 电信 | 显示全部楼层
顶技术贴···
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 21:27:20| 字数 102| - 瑞典 | 显示全部楼层
QUOTE:
Posted by 巴香水印 on 2010-8-12 21:14
顶技术贴···

偶尔写点看法,看了后能更加了解一下自己的cpu呵呵。

[ Edited by  dothan228 on 2010-8-12 21:29 ]
abcdefg
回复 支持 反对

使用道具 举报

2万

回帖

253

积分

1万

资产值

荣誉版主 Rank: 5Rank: 5Rank: 5Rank: 5Rank: 5

注册时间
2009-9-5
发表于 2010-8-12 21:29:44| 字数 25| - 甘肃省庆阳市 电信 | 显示全部楼层
所以。。。要买就是i7。。。。i3和i5都是骗钱的
用点评回复的,一律无视。因手机版无法回复点评。
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 21:32:09| 字数 133| - 瑞典 | 显示全部楼层
QUOTE:
Posted by 冰冻的山泉 on 2010-8-12 21:29
所以。。。要买就是i7。。。。i3和i5都是骗钱的
不算太骗吧,毕竟是有提升的。。。也许是为了留给sandybridge提升吧?

[ Edited by  dothan228 on 2010-8-12 21:34 ]
abcdefg
回复 支持 反对

使用道具 举报

9098

回帖

184

积分

4万

资产值

禁止访问

注册时间
2009-2-1
银牌荣誉勋章(注册10年以上会员)年全勤勋章2022铜牌荣誉勋章(注册8年以上会员)
发表于 2010-8-12 21:33:33| 字数 9| - 江苏省南京市 电信 | 显示全部楼层
来学习的,LZ牛人
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 21:35:20| 字数 68| - 瑞典 | 显示全部楼层
QUOTE:
Posted by vagabondcat on 2010-8-12 21:33
来学习的,LZ牛人

谢谢支持,牛人不敢当,写点看法而已。
abcdefg
回复 支持 反对

使用道具 举报

178

回帖

0

积分

279

资产值

入门会员 Rank: 1

注册时间
2007-2-11
发表于 2010-8-12 21:36:15| 字数 8| - 江苏省南京市鼓楼区 电信 | 显示全部楼层
学习一下 。前排顶
叉两百
回复 支持 反对

使用道具 举报

3851

回帖

31

积分

1万

资产值

白金会员 Rank: 3Rank: 3Rank: 3

注册时间
2009-11-18
发表于 2010-8-12 21:38:00| 字数 71| - 广东省深圳市 沃通网络发展有限公司 | 显示全部楼层
QUOTE:
Posted by 冰冻的山泉 on 2010-8-12 21:29
所以。。。要买就是i7。。。。i3和i5都是骗钱的

i7太贵了,买不起啊。
X61 LG2/T8100/2G/5K500.B/4965AGN/X3100
T420 HC1/i5-2450/8G/840Pro & 7K500/螃蟹卡/NVS4200/蓝指摄/G1
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 21:39:22| 字数 69| - 瑞典 | 显示全部楼层
QUOTE:
Posted by jingzi123123 on 2010-8-12 21:38

i7太贵了,买不起啊。

intel要赚钱,一分钱一分货。
abcdefg
回复 支持 反对

使用道具 举报

866

回帖

12

积分

1137

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2009-5-22
发表于 2010-8-12 21:51:51| 字数 16| - 贵州省贵阳市 联通 | 显示全部楼层
楼主又发技术贴了···膜拜···
回复 支持 反对

使用道具 举报

2744

回帖

36

积分

1580

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2002-8-26
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)
发表于 2010-8-12 21:57:45| 字数 14| - 安徽省合肥市 电信 | 显示全部楼层
台机的i5 750是什么状况?
Thinkpad的时代结束了
回复 支持 反对

使用道具 举报

273

回帖

0

积分

448

资产值

入门会员 Rank: 1

注册时间
2009-9-29
发表于 2010-8-12 21:57:57| 字数 6| - 辽宁省沈阳市 电信 | 显示全部楼层
顶技术贴!~
ThinkPad R61i 7742BFC T2410/2G/160G/NV140M
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 21:59:54| 字数 90| - 瑞典 | 显示全部楼层
QUOTE:
Posted by Bestir on 2010-8-12 21:57
台机的i5 750是什么状况?

i5 750是lynnfield的无超线程版本。内存性能很好。就是没有超线程而已。
abcdefg
回复 支持 反对

使用道具 举报

285

回帖

0

积分

832

资产值

入门会员 Rank: 1

注册时间
2007-7-10
发表于 2010-8-12 22:00:15| 字数 11| - 浙江金华 联通 | 显示全部楼层
楼主,你知道的太多了,
t60 200772u t2500 2g 320g x1400 15.1 1400*1050ips 蓝牙指纹无线
回复 支持 反对

使用道具 举报

1万

回帖

69

积分

5688

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2005-9-5
发表于 2010-8-12 22:32:26| 字数 73| - 江苏省南京市 电信 | 显示全部楼层
QUOTE:
Posted by 冰冻的山泉 on 2010-8-12 21:29
所以。。。要买就是i7。。。。i3和i5都是骗钱的


i7 620M还是不行,呵呵
回复 支持 反对

使用道具 举报

178

回帖

0

积分

378

资产值

入门会员 Rank: 1

注册时间
2008-11-8
发表于 2010-8-12 22:34:00| 字数 24| - 广东省广州市 电信 | 显示全部楼层
不顶的话就对不起LZ的打字所花费的时间了~~~~
X22,T43,T60,NC6400,X40,T61集显,t400--T9400ES,双显
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 22:34:54| 字数 72| - 瑞典 | 显示全部楼层
QUOTE:
Posted by linpey on 2010-8-12 22:34
不顶的话就对不起LZ的打字所花费的时间了~~~~

用x201打的,很快的。
abcdefg
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 22:35:44| 字数 87| - 瑞典 | 显示全部楼层
QUOTE:
Posted by skyshihui on 2010-8-12 22:32


i7 620M还是不行,呵呵

620m不过是体制比较好而已。。。一样是通过QPI连接的,速度也一样。
abcdefg
回复 支持 反对

使用道具 举报

953

回帖

25

积分

2579

资产值

白金会员 Rank: 3Rank: 3Rank: 3

注册时间
2008-5-1
发表于 2010-8-12 22:45:20| 字数 28| - 日本 | 显示全部楼层
这些年头已经看不懂这些新名词了

想当年期期买电脑报就知道了
回复 支持 反对

使用道具 举报

2744

回帖

36

积分

1580

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2002-8-26
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)
发表于 2010-8-12 22:45:36| 字数 29| - 安徽省合肥市 电信 | 显示全部楼层
是不是这个“胶水”粘得不够好啊。

看来要直接上i7 720了。
Thinkpad的时代结束了
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 22:49:40| 字数 99| - 瑞典 | 显示全部楼层
QUOTE:
Posted by Bestir on 2010-8-12 22:45
是不是这个“胶水”粘得不够好啊。

看来要直接上i7 720了。

QPI适合粘cpu,不适合粘内存呵呵。i7 720太热了而且频率奇低。
abcdefg
回复 支持 反对

使用道具 举报

4302

回帖

64

积分

5万

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2007-5-26
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2010-8-12 22:50:29| 字数 14| - 山东省德州市 联通 | 显示全部楼层
这个必须顶。虽然没怎么读懂~
X61.t8100/x200.P8600.8G/x230I5.16G.ips
T40.PM745.5213A/T61.t9300.sxga+/T430.I5.8G.wxga+
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 22:55:49| 字数 100| - 瑞典 | 显示全部楼层
QUOTE:
Posted by 纷飞冷雨 on 2010-8-12 22:50
这个必须顶。虽然没怎么读懂~

帮忙做个测试http://www.ibmnb.com/thread-987989-1-1.html 呵呵。
abcdefg
回复 支持 反对

使用道具 举报

597

回帖

26

积分

3万

资产值

白金会员 Rank: 3Rank: 3Rank: 3

注册时间
2008-5-27
发表于 2010-8-12 23:07:38| 字数 4| - 四川省绵阳市 电信 | 显示全部楼层
顶技术贴
回复 支持 反对

使用道具 举报

scika - T50-79

857

回帖

45

积分

8万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2007-1-12
银牌荣誉勋章(注册10年以上会员)月全勤勋章铜牌荣誉勋章(注册8年以上会员)
发表于 2010-8-12 23:11:04| 字数 16| - 北京市 CNNIC会员北京电信互联网数据中心节点 | 显示全部楼层
看不懂,还是顶一下,“探索频道”
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 23:22:36| 字数 81| - 瑞典 | 显示全部楼层
QUOTE:
Posted by Bestir on 2010-8-12 22:45
是不是这个“胶水”粘得不够好啊。

看来要直接上i7 720了。

i7 720的内存性能的确很强悍。
abcdefg
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-12 23:55:19| 字数 62| - 瑞典 | 显示全部楼层
QUOTE:
Posted by scika on 2010-8-12 23:11
看不懂,还是顶一下,“探索频道”

可能说的不够简单易懂。
abcdefg
回复 支持 反对

使用道具 举报

647

回帖

17

积分

3052

资产值

白金会员 Rank: 3Rank: 3Rank: 3

注册时间
2008-11-25
发表于 2010-8-13 00:16:18| 字数 38| - 广东省深圳市 电信 | 显示全部楼层
我就怀疑我同事的I3处理器怎么跟我的T8300比差不多呢
原来并没有很大差距啊
回复 支持 反对

使用道具 举报

7633

回帖

44

积分

395

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2010-4-27
 楼主| 发表于 2010-8-13 00:32:41| 字数 118| - 瑞典 | 显示全部楼层
QUOTE:
Posted by pingguo00 on 2010-8-13 00:16
我就怀疑我同事的I3处理器怎么跟我的T8300比差不多呢
原来并没有很大差距啊

就是内存和QPI限制了i3的大幅度提升。解决了i3至少比现在有10-20%的增长。
abcdefg
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc

GMT+8, 2024-6-10 16:52 , Processed in 0.201698 second(s), 73 queries , Gzip On, OPcache On.

手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|联系我们|专门网

返回顶部