文章
日志
帖子
首页
论坛
博客
大讲堂
人才网
直播课
资讯
全部
通信/手机
综合电子
测试测量
半导体/EDA
微处理器
模拟/电源
可编程逻辑
嵌入式
汽车电子
医疗电子
工业电子
物联网
可穿戴
机器人/飞行器
其他科技
传感器/Mems
射频微波
人工智能
技术文章
全部
通信/手机
综合电子
测试测量
半导体/EDA
微处理器
模拟/电源
可编程逻辑
嵌入式
汽车电子
医疗电子
工业电子
物联网
可穿戴
机器人/飞行器
其他科技
传感器/Mems
射频微波
人工智能
频道
通信/手机
综合电子
测试测量
半导体/EDA
微处理器
模拟/电源
可编程逻辑
嵌入式
汽车电子
医疗电子
工业电子
物联网
可穿戴
机器人/飞行器
其他科技
传感器/Mems
射频微波
人工智能
登录
注册
创芯云服务 :
创芯大讲堂
|
创芯人才网 |
数字IC职业培训
EETOP诚邀线上IC培训讲师!
资讯
>
微处理器
>
内容
三星自研处理器架构的演变之路:从雄心勃勃到最终放弃
2020-06-04 13:02:33
来源:
EETOP
在ISCA(国际计算机体系结构研讨会)会议中,三星的SARC(三星奥斯汀研发中心)
CPU
开发团队发表了一篇题为“三星Exynos
CPU
架构的演变”的论文,详细介绍了该团队在其8年的发展过程中所做的努力,并介绍了其定制Arm的一些关键特征。
CPU
内核范围从Exynos M1到最新的Exynos M5
CPU
以及未发布的M6设计。
作为背景,三星的SARC
CPU
团队成立于2011年,以开发定制的
CPU
内核,然后三星LSI将其部署到其Exynos SoC中,从2015年在Galaxy S7中发布的第一代Exynos 8890开始一直最新的用于Galaxy S20的M5内核Exynos 990。目前,SARC已完成M6微体系结构,SARC在2019年10月传出
CPU
团队解散的消息之前,就已经完成了M6微架构。
在ISCA的论文中三星将开发团队的一些被认为值得保留的想法公布在公众面前,基本上反应了8年来的开发历程。
从M1到M6:持续演变的
CPU
微架构
本文提供了三星定制
CPU
内核之间的微体系结构差异的总体概览表:
披露内容涵盖了设计的一些众所周知的特征,如三星在HotChips 2016的最初M1
CPU
微体系结构的深挖以及在HotChips 2018的最新M3所披露的那样。它使我们可以洞悉我们在S10和S20评测中测得的新M4和M5微体系结构,并让我们对未来的M6有了初步的了解。
三星设计的一个关键特征是多年来,他们都是基于2011年开发的M1内核蓝图RTL为基础,多年来不断改进内核的功能模块。但到了M3,内核的设计发生了很大的变化。们从几个方面大幅扩展了内核,例如从4宽设计到6宽中核。
三星设计的主要特征是多年来,它基于2011年以M1内核开始的RTL为基础,并且多年来不断改进内核的功能模块。到M3的设计发生了很大的变化,从几个方面大幅扩展了内核,例如从4-wide设计到6-wide中核。
之前尚未公开的新披露内容将涉及新的M5和M6内核。对于M5,三星对内核的缓存层进行了较大的更改,例如用新的更大的共享缓存替换了私有L2缓存,以及公开了L3结构从3组设计到2组的变化。具有较少延迟的Bank设计。
就微体系结构而言,正在开发中的尚未发布的M6内核似乎是一个更大的飞跃。SARC团队在这里进行了较大的改进,例如将L1指令和数据缓存从64KB增加到128KB,这是目前苹果的
CPU
核心从A12开始才实现的设计选择。
据说L2的带宽能力提高了一倍,最高可达64B /周期,L3的带宽也将从3MB增加到4MB。
M6可能是8-wide解码核心,据我们所知,这将是我们所知道的最宽的商业微体系结构-至少在解码方面。
有趣的是,即使内核要宽得多,整数执行单元也不会做太多改变,只是看到一个复杂的管道增加了第二个整数除法能力,而加载/存储管道将保持与上一个相同。具有1个加载单元,1个存储单元和1个1加载/存储单元的M5。
在浮点/ SIMD 流水线上,我们将看到具有FMAC功能的第四个单元。
TLB可能会发生一些大变化,例如L1 DTLB从48页增加到128页,而主TLB从4K页增加到8K页(32MB覆盖)。
自M3以来,M6也是第一次,将增加内核的无序窗口,并使用更大的整数和浮点物理寄存器文件,以及从以下时间开始增加ROB(重排序缓冲区):228至256。
SARC内核的一个主要弱点似乎仍然存在于M5和即将推出的M6内核中,这是其更深层次的流水线阶段导致相对昂贵的16周期错误预测损失的结果,远高于Arm的最新设计(11级)周期。
这篇论文更深入地介绍了分支预测器设计,展示了基于核的可缩放哈希感知器设计。这些年来,设计一直在不断改进,提高了分支的准确性,从而不断降低了MPKI(mis-predictsper kilo-instructions)。
如下的一个有趣的表格显示的是分支预测器在前端所占用的存储结构数量,单位为Kbytes:
本文进一步详细介绍了内核的预取方法,包括M5代的μOP缓存的引入,以及团队对内核的安全漏洞(如Spectre)的抵御。
IPC的改进:每年递增20%,6年达到2.71倍
本文进一步描述了SARC团队为改善各代产品的内存延迟所做的努力。在M4核心中,团队采用了负载-负载级联机制,将后续负载的有效L1周期延迟从4个周期减少到3个周期。M4还引入了带有新接口的路径旁路,从
CPU
核心直接到内存控制器,避免了通过互连的流量,这解释了我们在Exynos 9820中看到的更大的延迟改进。M5引入了推测性高速缓存查找旁路,同时向互连和高速缓存标签发出了一个请求,这可能节省了高速缓存未命中的等待时间,因为内存请求已经在进行中。通过数代迭代发展,平均负载延迟不断得到改善,从M1上的14.9个周期下降到M6上的8.3个周期。
在IPC改进方面,SARC团队在过去的8年中已设法平均每年获得20%的改进。如图所示,M3特别是IPC的一大飞跃。M5与我们在基准
测试
中看到的大致相关,大约提高了15-17%。据披露,M6的IPC平均值为2.71,而M1的平均值为1.06,此处的图表通常似乎表明与M5相比提高了20%。
放弃自研
在会议的问答环节中,论文的主持人布莱恩·格雷森(Brian Grayson)回答了有关自研架构计划取消的问题。团队在每一代产品的性能和效率改进方面一直都是按计划进行的。据说,团队最大的困难是对未来的设计变更非常小心,因为团队永远没有资源完全从头开始或完全重写代码块。事后看来,团队在过去会对一些设计方向做出不同的选择。这种串行化的设计方法与Arm的定位形成了鲜明的对比,Arm有多个跃迁设计中心和
CPU
团队,让他们可以做一些类似于Cortex-A76这样的接地气的重新设计的事情。
对于即将到来的M7等核心,团队有很多改进的想法,但据说取消该计划的决定来自于三星的高层。与Arm的设计相比,SARC的
CPU
核心从来就没有那么强的竞争力,在功耗效率、性能和面积使用方面都有所下降。由于Arm上周发布了最新的Cortex-X1以获得全面的性能,因此在我看来SARC的M6设计可能会遇到与之竞争的问题。
免责声明:本文由作者原创。文章内容系作者个人观点,转载目的在于传递更多信息,并不代表EETOP赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时联系我们,我们将在第一时间删除!
关键词:
三星
处理器
COU
EETOP 官方微信
创芯大讲堂 在线教育
创芯老字号 半导体快讯
相关文章
上一篇:
厉害了我的“妈”!2019全球CEO薪酬排
下一篇:
3代锐龙大卖!德国AMD处理器持续热销:
延伸阅读
三星宣布完成5纳米EUV工艺研发
三星系统LSI业务部购买Arteris IP的FlexNoC®互连技术 用于数字电视芯片
三星与AMD达成战略合作:联手对抗高通与英伟达
三星与超威半导体签高性能图形处理战略合作协议
全部评论
最新资讯
最热资讯
自主瓶颈巨大:俄罗斯芯片一半次品!
美国即将披露中国先进芯片厂名单
中国闪存突破!“廉价”QLC性能追平TLC
中芯国际2023年获利大幅下滑50.4%,2024
光刻机龙头ASML要走 荷兰出手送大招:预留
罗克韦尔自动化携手英伟达 拓宽 AI 在制
新型的FPGA器件将支持多样化AI/ML创新进程
东芝推出带有嵌入式微控制器的SmartMCD™系
成本数倍成长,讲好的补贴不给!台积电遭遇
IAR率先支持瑞萨首款通用RISC-V MCU,树立
最新Omdia研究显示,2023年半导体市场收入
Melexis推出动态RGB-LED应用新型开发方案
Melexis推出动态RGB-LED应用新型开发方案
高通、英特尔、Google 组队打Nvidia!拟靠oneAPI推翻CUDA势力
苹果花更多钱回购股票而非研发,被美国司法部列为“缺乏竞争”的证据
第四次工业革命大幕速起,实现伟大复兴要严防对海外人工智能技术的三大依赖
国际半导体产业协会预估台积电、英特尔年内建成 2nm 晶圆厂
建设高端半导体装备,SRII赋能新一代集成电路制造
高通推出两款下一代音频平台,面向高端和中端层级耳塞、耳机和音箱提升无线音频体验
Vicor的48V供电架构可以支持12V系统
总投资630亿!京东方国内首条 8.6 代 AMOLED 生产线奠基
全栈式持续助力新能源车电力创新,泰克参加ATC汽车测试技术周
手把手教你制作高速吹风机
英飞凌参加2024年美国国际电力电子应用展览会, 以丰富的功率解决方案组合推动低碳化和数字化进程
业界最热文章
达摩院院长张建锋:RISC-V迎来蝶变,进
遥遥领先!AMD发布地表最强工作站CPU:
华为海思同比暴增24471%!
堪比90年代游戏机,印度国产RISC-V CPU
PC巨头裁员!
苏姿丰亲临中国!AMD AI PC创新峰会即将开幕
摩尔线程声明:未受影响!
英伟达新架构以他名字致敬,天才数学家Da
兆易创新推出GD32F5系列Cortex®-M33内核
技术架构揭秘:英特尔第五代至强可扩展处
麒麟9000S VS 9000 蕞详细评测:主频
黄仁勋透露英伟达下一代 DGX AI系统将
IBM发布2023年度报告:董事长兼首席执行
英伟达发布最强AI加速卡--Blackwell GB2
英伟达股价再创历史新高 市值已是AMD六倍
商务部部长王文涛会见AMD公司董事会主席
浅谈多核心CPU和SoC芯片及其工作原理
爱芯元智入选2024玄铁优选伙伴:发展AI计
嘉楠基于RISC-V的端侧AIoT SoC采用了
Arm 引领全新的汽车产品开发方式
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台
论坛
博客
大讲堂
人才网
直播课
关于我们
联系我们
隐私声明
@2003-2024 EETOP
京ICP备10050787号
京公网安备:11010502037710
×