找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 2317|回复: 0

[CPU] 骁龙600架构深入分析、CPU/GPU详细测试

[复制链接]
hotfox 发表于 2013-4-8 20:47:20 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
2012年初,旗舰级的智能手机处理器是高通MSM8960,两个Krait CPU核心,Adreno 225 GPU核心,LTE基带整合,台积电28nm LP工艺制造。到了年底,它就让位给骁龙S4 APQ8064,四个Krait 200 CPU核心,Adreno 320 GPU核心,MDM9x15 LTE基带整合,制造工艺不变。
现在,顶级手机处理器又变成了骁龙600,拥有四个Krait 300 CPU核心、Adreno 320 GPU核心。再往上还有骁龙800,配备四个Krait 400 CPU核心、Adreno 330 GPU核心,但要到下半年才能看到它。往下还有低端的骁龙400、骁龙200。
s_3db98e3c84ed4d3ebc74a5f4c29aed87.png
【Krait新老架构对比:提升好猛】
Krait 300 CPU架构上做了几十项小幅度的调整,但绝大部分都从未公开过。它还是28nm LP工艺制造,但代工的不止是台积电,还有三星,以及可能的第三家伙伴。
Krait 300的流水线没有发生任何变化,不过高通宣称它可以在不加压的情况下提升运行频率。事实上也的确如此,HTC Droid DNA里的APQ8064最高为1.5GHz,HTC One APQ8064T则跑到了1.7GHz,三星Galaxy S4里更是最高可达1.9GHz。
当然和以前一样,Krait 300的每个核心都支持电源栅极,可以独立运行于自己的电压、频率,有利于节省功耗。
Krait 300引入了一个硬件三级缓存数据预取器,通过空闲的内存带宽提前将数据在实际使用之前就带入二级缓存。其实,任何类型的预取(或者预测执行)都需要很大的功耗做代价,所以在移动芯片里并不多见,除非有很先进的制造工艺。
分支预测精确度也有所改进,可以比程序规定的执行更多指令,但仍然不像Cortex-A15那样是完全的乱序执行架构,只是部分而已。
最后,高通宣称浮点、JS性能都有了改进,但暂时没有细节。
总的来说,高通称Krait 300的性能可在同频下提升15%,再加上频率的拔高可以在高端看到25-30%的进步。
真的如此么?AnandTech就对HTC One来了一次深入测试,它的处理器就是四核骁龙600 1.7GHz,而作为对比的是HTC Butterfly,处理器是四核APQ8064 1.5GHz,分别在默认主频、1.7GHz同频下进行PK。
s_1d935db7873b4db2a18f60877a6a6e25.jpg
首先来看整数性能。这里只用整数数据,一般都小得足以塞进二级缓存。每项测试都分别跑单线程、多线程(带MT标记的)。
s_5b3dac1494a6437bbd458806e8b27d0e.png
同样的1.7频率下,Krait 300所有项目都有了明显的提升,尤其是多线程的Blowfish加解密、文字压缩、LUA质数运算都翻了一番还多,甚至逼近2.5倍,最少的单线程文字解压缩也有15%以上,平均下来单线程43.1%、多线程90.6%,在真实应用中提升个15%绝对很轻松。
接下来是浮点性能。
s_5f141a69a74b4840892142874671ac9a.png
多线程的Mandlebrot曼德洛特集渲染、Dot Product点乘计算都翻了一番以上,图片模糊项目也近乎翻倍,但也有三个项目在30%上下,因此总体而言多线程平均提升了83.8%,略弱于整数。
不过单线程更强劲,除了图片模糊稍低(但也超过了1/3),其它都至少有60%,因此单线程提升平均达到了68.3%。
Krait 300上的小尺寸计算负载绝对会有极为明显的提速。
接下来是内存性能,只是因为它和频率没什么关系,就直接原始主频对比了。
s_366bdcd86fad49d3830b6eccac1ebc65.png
持续读写都达到了原来的三倍多,相当凶猛。STREAM则能体现持续内存带宽,只增加了15%。其它项目提升得或多或少,但总体来看Krait 300的内存性能仍然有了很大的进步。
最后使用AndEBench。
s_7527eb2b90a444e4acaa05beca0506d9.png
原生性能提升了不到20%,Java得分则增加了70%以上,基本验证了刚才GeekBench的测试结果。
总的来说,Krait 300从寄存器文件访问到整数/浮点计算都有了大幅度的改进,数据前送、分支预测改进也都对性能有直接影响,所有核心同时工作的多线程表现也出色了很多。持续内存带宽增加不多,但是别忘了,Krait架构本身就有了比较充裕的内存带宽了(相比于Cortex-A9)。
这说明,Krait 300虽然只是微架构调整,而不是重大革新,但在性能上的变化是足够让人惊喜的。

【骁龙600 CPU性能实测】
底层架构方面看完了,再来看看骁龙600 HTC One上的实际表现,尤其是和其它手机的对比。
4fde6115238c435597dfb906104481ab.png
SunSpider JS性能:表现平平,但感觉应该是软件和浏览器优化不足所致,而不是硬件不够格。
45c7a89780e44f2b80329606eebb4cd5.png
Google Octane JS性能:这次基本逼近了Atom,但还是不如Cortex-A9架构、频率稍低的Exynos 4412。
861f97cad52548d38b8fee4e01f9ae49.png
Kraken JS性能:在这里,骁龙600的性能仅次于Nexus 10平板里的四核Cortex-A15,在手机中冠绝群雄。
3eef20a35c0c4540a5c8b7cd69410977.png
BrowserMark浏览器性能:Note 2又是手机里最好的,几乎追上来Nexus 10。骁龙600则有点偏低。
39e9f9d43adb47f4aca58ec098101b1f.png
Vellamo HTML5测试:骁龙600彻底亮了,成绩远远甩开Exynos 4412,APQ8064更不在话下。
951c645b543b4469b77b5128c671531b.png
Vellamo Metal测试:再次稳赢其它手机。
骁龙600 CPU的实际表现也值得称道,根据不同应用有着不同程度的提升,而且还有进一步优化的空间。在系统流畅度上,HTC One也是当今最出色的。
不过Cortex-A15架构正在高端中开始普及,骁龙600面对它们能坚持住么?

【骁龙600 GPU性能实测】
图形核心方面还是Adreno 320,更高级的Adreno 330要在骁龙800上才能看到,但即便如此,这颗GPU到现在也是很强大的,高通更是宣称其频率也比S4 Pro、APQ8064上的更快。
同时还有个好消息,Nexus 4 APQ8064曾经遭遇的过热降频问题现在没有了(以下图表中还加入了Nexus 4在冰箱里的成绩),但奇怪的是,thermald.conf散热配置文件现在是二进制的,无法直接访问。为什么不让看呢?
c7337600276246bcb130816ea23e1569.png
填充率比Nexus 4上高了大约14%。
2489bc65d6444e7e8fb2d666e01f440c.png
1080p屏幕的好处就是统一分辨率渲染结果不会变。
91e71bd40fdc43678054345c7b7724dd.png
4e4d294814de49d4b2eabe68379eff39.png
三角形输出和Nexus 4上差不多,这说明骁龙600 GPU频率控制得不错(但具体多少还不清楚,要么是降低频率但效率提高了,要么是提升频率但散热优化了)。
bde6ea15d32240ae826e31aba083a174.png
1080p统一分辨率渲染下就能领先了。
ee211fc5d0504814b0788440bd0b645f.png
0cb06842f55d4c63ae98f5f2bfd37e1e.png
dc3df62f7bdc447791f4a57154b64d1b.png
4c5ef8a5517c411bac3186006603e588.png
e0b3ddeedd9e48d9b2481ca6e19bb71e.png
埃及高清场景测试中,1080p分辨率下骁龙600拔得头筹,是该项目有史以来的最好成绩,但比之前提升得并不算很多。
65d4c4887852449899dc9bec3ce26fb7.png
a416ecb4bb6c4dd88a29cbd92104fddb.png
埃及经典场景中同样很出色。
论坛发展靠大家,积极提供资源;请勿灌水
通过分享您的互联网来赚钱
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|手机版|小黑屋|存档|商匡数科 ( 沪ICP备19008575号-1 )

GMT+8, 2024-7-5 07:43 , Processed in 0.083306 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表