文章
日志
帖子
首页
论坛
博客
大讲堂
人才网
直播课
资讯
全部
通信/手机
综合电子
测试测量
半导体/EDA
微处理器
模拟/电源
可编程逻辑
嵌入式
汽车电子
医疗电子
工业电子
物联网
可穿戴
机器人/飞行器
其他科技
传感器/Mems
射频微波
人工智能
技术文章
全部
通信/手机
综合电子
测试测量
半导体/EDA
微处理器
模拟/电源
可编程逻辑
嵌入式
汽车电子
医疗电子
工业电子
物联网
可穿戴
机器人/飞行器
其他科技
传感器/Mems
射频微波
人工智能
频道
通信/手机
综合电子
测试测量
半导体/EDA
微处理器
模拟/电源
可编程逻辑
嵌入式
汽车电子
医疗电子
工业电子
物联网
可穿戴
机器人/飞行器
其他科技
传感器/Mems
射频微波
人工智能
登录
注册
创芯云服务 :
创芯大讲堂
|
创芯人才网 |
数字IC职业培训
EETOP诚邀线上IC培训讲师!
资讯
>
微处理器
>
内容
光线追踪的相干性聚集:硬件光线追踪的优势
2020-03-24 08:18:31
来源:
Imagination
尽管在理论上实现现代
GPU
的方法是无限的,但真正有效的方法是切实地了解问题并着手将方案变为现实。制造现代高性能
半导体
器件以及试图加速当前可编程光栅化技术所面临的问题揭示了
GPU
硬件行业发展的未来趋势。
例如在现代
GPU
中SIMD处理和固定功能纹理单元是必不可少的,以至于不使用它们来设计的
GPU
方案几乎肯定意味着在研究之外不具有商业上的可行性和实用性。即使是过去20年来,任何一个
GPU
最疯狂的愿景也没有舍弃这些核心原则(安息吧,Larrabee(
英特尔
公司
GPU
的
芯片
代号))。
过去15年来实时光线追踪加速一直被默认为是
GPU
设计中最令人烦心的问题,关于光线追踪应该如何在
GPU
上实现的主流规范是微软推出的DXR,它要求的执行模型却不能真正融入
GPU
的工作模式,这无疑给任何需要支持它的
GPU
设计者带来一些严重的潜在问题。如果实时光线追踪是它们过去十年时间没有考虑过的事情,那么这个问题会更加明显,而Imagination一直在关注这个问题。
光线追踪面临的关键挑战
如果你遵循DXR规范并考虑需要在
GPU
中实现些什么从而提供计算加速性能,那么你将很可能快速梳理出以下这几个不管采用何种设计方案都需要解决的问题:
首先,你需要一种方法来生成和处理一组包含几何体的数据结构,从而能以更有效的方式根据几何体来跟踪光线。其次,当追踪光线时,
GPU
要
测试
光线是否与之相交,要提供一些用户可定义的编程接口。第三,被跟踪的光线可以发出新的光线!DXR规范定义的实现方案还需要考虑其他问题,但是从全局来看这三个因素是最重要的。
PowerVR光线追踪混合渲染效果
生成和使用加速数据结构来有效地表示需要做相交
测试
的几何体意味着
GPU
可能要完成一个全新的执行阶段,然后我们需要用全新的接口函数处理这些新的数据结构,
测试
是否相交,之后在程序员的控制下根据相交
测试
的结果实现一些功能。
GPU
是并行的设计,所以同时处理一堆光线意味着什么?这样做是否发现了新挑战,而这些挑战与传统的几何和像素并行处理所带来的挑战却大不相同?
上一个问题的答案是非常肯定的,的确这些差异对如何将光线追踪映射到现有的
GPU
执行的模型中有着深远的影响。这些
GPU
存在计算资源和内存资源的不平衡,导致内存访问成为一种宝贵的资源,而浪费这些资源是导致效率和性能低下的最主要原因之一。
哦不——我们做了些什么?
GPU
被设计成可以任何形式充分利用与之连接的DRAM的访问,利用内存访问的空间或时间局部性来作为实现这一目的的方法。值得庆幸的是,最常见和最现代化的光栅化渲染有一个很好的特性,即在着色期间(尤其是像素着色通常是任何给定帧的主要工作负载)三角形和像素顶点有可能与它们的近邻共享相关数据。因此,您访问一组像素所需的任何缓存数据,很可能下一个相邻的组将需要使用您已经从DRAM中提取并缓存的部分或全部内存数据。对于当今大多数栅格化渲染工作负载而言,这都是正确的,因此我们都可以松一口气,并围绕该属性设计
GPU
架构。
当我们使用光线追踪,这些就都失效了。光线追踪使所有空间局部性消失。下面让我们来分析其中的原因。
物体表面的问题
最简单的思考方式就是观察四周,在你坐下来阅读这篇文章时注意光线在你所处环境中的作用。由于光线追踪建模了光线从所有光源传播时的属性,因此它必须处理光线照射在场景中任何表面时发生的情况。也许我们只关心光线照射哪些物体,也许物体的表面以均匀的方向散射光线,但它也可能完全是随机的。也许表面吸收了所有的光,因此不会有次级光线的传播。也许表面有一种材质属性,使它能够部分吸收几乎所有照射来的光线,然后随机散射它不能捕获的少量光线。
只有第一种场景可以映射到
GPU
的利用内存访问局部性的工作模式,即使如此也只有当所有并行处理的光线都照射到同一类型的三角形时才可以。
正是这种明显分歧的可能性导致了这些问题,如果并行处理的任何光线相互之间可能会有不同的作用,包括撞击不同的加速数据结构或发出新的光线,那么
GPU
能高效工作的基本前提就会被破坏,而且这通常比在传统的几何图形或像素处理中遇到的发散现象更具有破坏性。
相干性聚集
PowerVR对光线追踪硬件加速的实现所做的是硬件光线追踪和排序,它与当今行业内任何其他硬件光线追踪加速相比都是独一无二的,这对软件方面来说是完全透明的,确保硬件上并行追踪的发射光线具有潜在的相似性。我们称之为相干性聚集。
硬件维护了一个数据结构,用于层次化的存储软件发出的正在被硬件处理的光线,并能够根据它们的方向按它们在加速结构中前进的位置进行选择和分组。这意味着当它们被处理时更可能共享存储器中被访问的加速数据结构中的数据,且额外的优势是能够最大化随后要并行处理的光线-几何体相交计算的数量。
通过分析由硬件调度的光线,我们可以确保以
GPU
友好的方式对它们进行分组,从而更高效地进行后续处理,这些是该系统成功的关键,有助于避免打破
GPU
行业为高效的光栅化渲染而精心设计的运行模式,这就避免了光线追踪硬件对特殊类型存储系统的需求,因此提供了与
GPU
的其他部分更容易集成的方案。
相干性聚集机制本身相当的复杂,因为它需要快速的追踪,排序和调度所有被提交到硬件中处理的光线,从而不会反压前级用于发射光线的调度系统,也不会造成后级以排序好的光线和加速数据结构为输入的硬件的空闲。
如果没有硬件系统来帮助
GPU
处理光线排序,那么就需要依赖应用程序或游戏开发人员以某种方式在主机上处理光线的相干性问题,或者在
GPU
上加入一个中间的计算环节来处理光线排序——前提是这种方式被硬件所支持,以上假设的方式中没有一个能在实时的硬件平台上提升效率和性能,然而Imagination是市场上唯一拥有这种硬件光线追踪系统的
GPU
IP供应商。
紧跟潮流
Imagination之所以成为行业内唯一针对硬件光线追踪提供解决方案的供应商是因为我们已经致力于解决这个问题很长时间了。与行业中其他一些正在缓慢进展的技术相比,光线追踪已经成为当今图形技术广泛采用API之一。
我们的相干性聚集特性与目前行业的光线追踪相互兼容(如果光线恰好发射出新的光线,堆栈将会被释放也可能发射出新的光线等等),在每个阶段进行相干性聚集处理并确保我们尽可能地实现硬件光线追踪的强大性能。
在现代的硬件光线追踪系统中最重要的是
测量
光线束、峰值并行
测试
率或空光线发射和未命中率,这些是描述光线追踪硬件性能的简单方式,但是也并不是非常的有用,毕竟开发人员并不只关心高峰值并行
测试
率或漏测率。
我们的目标是在整个加速系统中使用全面的光线追踪,这样开发人员就可以用光线束预算要实现哪些有用的功能。我们的相干性聚集系统与我们提供的解决方案共同实现了这个目标,与行业内的其他方案相比是独一无二的。
关键词:
GPU
imagination
EETOP 官方微信
创芯大讲堂 在线教育
创芯老字号 半导体快讯
相关文章
上一篇:
Intel 5核心第二款型号i5-L15G7现身:
下一篇:
Gartner:2019全年全球服务器出货量下
延伸阅读
海外首秀!曙光新款GPU服务器亮相GTC2019
英特尔PK英伟达,双英大战为哪般?
为了独立GPU Xe,英特尔“挖”了多少前AMD顶级专家?
ARM发布新一代 GPU 架构,还有一个机器学习处理器
全部评论
最新资讯
最热资讯
成本数倍成长,讲好的补贴不给!台积电遭遇
IAR率先支持瑞萨首款通用RISC-V MCU,树立
最新Omdia研究显示,2023年半导体市场收入
Melexis推出动态RGB-LED应用新型开发方案
高通、英特尔、Google 组队打Nvidia!拟靠
苹果花更多钱回购股票而非研发,被美国司法
第四次工业革命大幕速起,实现伟大复兴要严
国际半导体产业协会预估台积电、英特尔年内
建设高端半导体装备,SRII赋能新一代集成电
高通推出两款下一代音频平台,面向高端和中
Vicor的48V供电架构可以支持12V系统
总投资630亿!京东方国内首条 8.6 代 AM
总投资630亿!京东方国内首条 8.6 代 AMOLED 生产线奠基
全栈式持续助力新能源车电力创新,泰克参加ATC汽车测试技术周
手把手教你制作高速吹风机
英飞凌参加2024年美国国际电力电子应用展览会, 以丰富的功率解决方案组合推动低碳化和数字化进程
是德科技推出支持 Wi-Fi 7性能测试的E7515W UXM 无线连接测试平台
半导体最新排名
苹果在华出货量持续暴跌!
被华为超越,戴尔成最大输家!
全栈式持续助力新能源车电力创新,泰克参加ATC汽车测试技术周
品英Pickering公司推出最新大功率舌簧继电器,额定功率高达 80W
IBM与英伟达™(NVIDIA®)合作推动企业就绪型人工智能的大规模应用
知情人士称苹果与百度尚未达成AI合作
业界最热文章
达摩院院长张建锋:RISC-V迎来蝶变,进
华为海思同比暴增24471%!
遥遥领先!AMD发布地表最强工作站CPU:线
堪比90年代游戏机,印度国产RISC-V CPU
PC巨头裁员!
苏姿丰亲临中国!AMD AI PC创新峰会即将开幕
摩尔线程声明:未受影响!
英伟达新架构以他名字致敬,天才数学家Da
兆易创新推出GD32F5系列Cortex®-M33内核
技术架构揭秘:英特尔第五代至强可扩展处
麒麟9000S VS 9000 蕞详细评测:主频
黄仁勋透露英伟达下一代 DGX AI系统将
IBM发布2023年度报告:董事长兼首席执行
英伟达发布最强AI加速卡--Blackwell GB2
英伟达股价再创历史新高 市值已是AMD六倍
商务部部长王文涛会见AMD公司董事会主席
浅谈多核心CPU和SoC芯片及其工作原理
爱芯元智入选2024玄铁优选伙伴:发展AI计
嘉楠基于RISC-V的端侧AIoT SoC采用了
Arm 引领全新的汽车产品开发方式
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台
论坛
博客
大讲堂
人才网
直播课
关于我们
联系我们
隐私声明
@2003-2024 EETOP
京ICP备10050787号
京公网安备:11010502037710
×