马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
AMD的新架构大大加强了加速计算能力,但依然称为“AMD Graphics Next”,可见传统的图形仍会有相当高的的地位,事实上AMD也在演讲中强调了3D图形仍然会继续进化。另一方面,AMD图形和计算架构并不是单独进化,而是隶属于更大的体系“Fusion系统架构”(FSA)的一部分,也就是说今后GPU、CPU会联系得越来越紧密,共同加速。
这里我们就再结合Eric Demers的演讲幻灯片看看AMD的图形核心架构是如何从昨天走到今天,又是准备如何一步一步走向明天。由于各方面的限制,这里不太可能做太详尽的介绍,只是走马观花预览一下,对更深入细节感兴趣的同学可以对着幻灯片好好研究研究。
Eric Demers
GPU演化第一阶段:2002年前,固定功能,专为图形服务,没有通用计算能力
第二阶段:2002-2006年,简单的Shader,以图形为主,支持浮点处理
DX8、DX9下的第一代Shader
第三阶段:2007年至今,图形并行核心,图形仍是关键,统一Shader架构,基本的通用目的计算
第三阶段进化:2010年至今,GPU计算,图形还是很重要,但也针对计算优化,实现高性能计算
VLIW5架构
对称的VLIW4架构
GPU计算能力的进化
AMD Fusion系统架构(FSA)路线图:物理集成(当前阶段)、平台优化、架构集成、系统集成
新架构中占据核心地位的计算单元(CU)
每个计算单元中都有四个SIMD单元(共享16KB一级只读缓存和32KB一级指令缓存),各自可处理10个Wave,总计40个;一个矢量单元,每时钟周期可处理四个线程
全面的可读写缓存设计,每个计算单元16KB一级数据缓存、64KB二级缓存,而且后者可与所有前者互连
CPU使用MMU(内存管理单元),GPU使用IOMMU(输入输出内存管理单元);CPU、北桥和GPU使用统一寻址空间,都使用相同的x86 64位指针,无需转移数据
Fusion系统架构特点总结:GPU全面支持C/C++和其它高级语言,CPU/GPU统一虚拟寻址空间,GPU可以访问所有系统内存并处理分页错误,CPU/GPU之间保持内存一致性,GPU具备优先调度和上下文切换,FSA可同时用于独立显卡和Fusion APU,今后每年都会增加新特性
3D图形自然不会背抛弃,也会随同进化,而且GPU内仍会有固定功能硬件,未来还会实现FSA、3D的融合,让计算能力为3D图形服务
AMD下一代图形和计算架构要点
多任务统一计算:异步计算引擎(ACE)、多重并发上下文
可扩展的多任务图形引擎
原语管线和像素管线都可以灵活扩展
但是它们都使用统一Shader核心
异步计算引擎控制各个计算单元:命令管理器、独立和并发网格/团体调度器、实时任务调度、后台任务调度、计算任务图形处理、错误检测与校正(EDCC)
计算单元详细架构
计算单元详细架构
指令缓冲与欲取
指令仲裁与解码
分支与信息单元
整数标量单元
矢量ALU单元
非VLIW矢量引擎
本地共享内存(LDS)
矢量内存操作
可读写缓存
多级可读写缓存
标量+矢量
|
|