新闻详情

苹果官方发布视频介绍 A17 Pro 和 M3 系列芯片的 GPU 技术细节

2023-11-10

3845

近日,苹果官方发布了时长将近半小时的开发者视频,详细介绍 M3 系列芯片和 A17 Pro 芯片中的诸多技术细节,并通过基础术语解释了改进原理等。


视频中表示开发者使用 Metal API 构建应用程序过程中,不需要更改现有应用程序代码就能看到 M3 和 A17 Pro 的性能提升。这些芯片组利用动态缓存(Dynamic Caching)、硬件加速光线追踪和硬件加速网格映射等,大幅提高了 GPU 表现。



动态缓存


苹果在 M3 和 A17 Pro 中引入了下一代着色器核心,应用调用 GPU 核心时,这些着色器可以更加高效运行,大大提高输出性能。


苹果官方发布视频介绍 A17 Pro 和 M3 系列芯片的 GPU 技术细节


通常,GPU 只能根据执行操作期间执行操作中的最高带宽进程分配寄存器内存。因此,如果操作的某一部分需要比其他部分多得多的寄存器内存,则该操作将为给定进程使用更多的寄存器内存。


动态缓存允许 GPU 为其执行的每个操作分配恰到好处的寄存器内存量,释放以前不可用的寄存器内存,允许并行执行更多着色器任务。


灵活的片上存储器


以前,片上存储器(on-chip memory)会为寄存器、线程组和带有缓冲区缓存的切片存储器分配固定的内存。这意味着,如果一个操作使用一种类型的内存比另一种类型的内存更多,那么大部分内存就会被闲置。


苹果官方发布视频介绍 A17 Pro 和 M3 系列芯片的 GPU 技术细节


苹果调整让所有片上存储器都可以用于存储器类型的缓存。严重依赖线程组内存的操作可以利用片上内存的整个跨度,甚至可以将操作溢出到主内存中。


着色器内核可动态调整片上内存占用率,以最大限度地提高性能,这意味着减少开发者的应用优化时间。


着色器核心的高性能 ALU 管线


苹果建议开发人员在其程序中执行 FP16 数学运算,但高性能 ALU 并行执行整数、FP32 和 FP16 的不同组合。


苹果官方发布视频介绍 A17 Pro 和 M3 系列芯片的 GPU 技术细节


指令在并行执行的不同操作中执行,这意味着 ALU 利用率会随着占用率的提高而提高。


如果不同的操作包含相同的 FP32 或 FP16 指令,这些指令将在不同的时间点执行,则可以重叠执行以增加并行性。


硬件加速图形管道


硬件加速大幅加快光线追踪过程,重要的交叉计算从 GPU 功能中移除。由于硬件负责部分计算,因此允许并行展开更多操作,从而加快硬件组件的光线追踪速度。


苹果官方发布视频介绍 A17 Pro 和 M3 系列芯片的 GPU 技术细节


硬件加速网格着色使用类似的方法。它采用几何计算管道的中间,并将其传递给专用单元,从而允许更多并行操作。


特别声明:本文版权归文章作者所有,仅代表作者观点,不代表爱思助手观点和立场。本文为第三方用户上传,仅用于学习和交流,不用于商业用途,如文中的内容、图片、音频、视频等存在第三方的知识产权,请及时联系我们删除。

相关标签

Windows
Mac OS
iOS
Android
Linux
爱思助手
Windows 64位 适用本机
V9.05 2025-10-20
立即下载
Windows 32位 适用本机
V9.05 2025-10-20
立即下载
爱思助手 V9.0
2025-10-15
请通过“爱思助手电脑端”来安装“iOS 端”
1、 安装“爱思助手的 Win/Mac/Linux 中任意一个电脑端”
2、 打开电脑端,用数据线连接设备到电脑
3、 连接成功后,等待电脑端自动为设备安装移动端,或在电脑端找到“安装移动端”手动点击安装
手机扫码安装“爱思助手”
爱思助手
deb 文件
V3.09.001 2025-10-24
立即下载
rpm 文件
V3.09.001 2025-10-24
立即下载
Windows
iOS
Android
TV
爱思投屏
Windows 64位 适用本机
V6.0.17 2025-09-29
立即下载
Windows 32位 适用本机
V6.0.17 2025-09-29
立即下载
iOS 设备无需安装应用,具体投屏步骤如下
1、 在 Windows 电脑上安装“爱思投屏”
2、 在 iOS 设备的“控制中心”中找到“屏幕镜像”
3、 点开屏幕镜像后,在列表中选择主机发起投屏
4、 或使用 USB 数据线将手机与电脑连接后发起投屏
手机扫码安装“爱思投屏”
爱思投屏TV V1.0.17
2025-10-13