先建立直觉,再进入工程细节
这一页不只给定义,而是按小白能跟上的顺序拆开:先用类比建立画面,再看真实工程怎么用,最后通过实验、误区和检查问题把知识固定下来。
入门解释
显卡负责把图像画出来,游戏画面、建模和很多 AI 计算都离不开它。
标准解释
GPU 拥有大量并行计算单元,适合处理图形渲染、矩阵计算与通用并行任务。
进阶解释
显存带宽、光栅与着色架构、计算核心调度以及主机到设备的数据传输效率,决定整体加速效果。
生活类比
GPU 像一座拥有大量小工位的并行工厂,适合把许多相似任务同时处理。图像里的像素、顶点、矩阵和 AI 张量,都能被拆成大量并行计算。
工程中怎么看
工程上看 GPU,要关注计算单元数量、显存容量、显存带宽、驱动生态、功耗散热和任务类型。不是所有程序都能被 GPU 加速,只有足够并行且数据搬运成本合理时才划算。
它在系统里负责什么
GPU 负责图形渲染、视频编解码、通用并行计算和 AI 加速。它通过 PCIe 与 CPU 通信,通过显存保存纹理、帧缓冲和计算数据。
关键知识点
- · 并行计算
- · 显存
- · 渲染
- · AI 加速
典型应用
- · 游戏渲染
- · 视频编解码
- · 深度学习
- · 图形工作站
从一帧画面理解 GPU 工作
打开一个 3D 场景或游戏性能监控,观察 GPU 占用、显存和帧率。
降低分辨率,观察像素数量减少后负载变化。
调整纹理质量,观察显存占用变化。
开启或关闭阴影、抗锯齿等效果,观察计算量变化。
用任务管理器比较视频播放、3D 渲染和 AI 推理对 GPU 的不同使用方式。
常见误区
以为 GPU 只和游戏有关,忽略 AI、视频和科学计算。
只看核心数量,不看显存带宽和软件生态。
忽略 CPU 到 GPU 的数据传输开销。
认为显存容量越大性能一定越强,忽略芯片和带宽。
Typical Circuit
PCIe 命令提交到帧输出
CPU 把绘制任务交给 GPU 并显示到屏幕
GPU 通过 PCIe 接收命令和资源,显存保存纹理、顶点和帧缓冲。渲染完成后,显示引擎按刷新节奏把帧数据送到显示器。
波形怎么看:CPU 提交命令后,PCIe 发生 DMA 传输;GPU 渲染队列工作,帧缓冲准备好后在 VBlank 附近切换输出。
参考画法:GPU command queue and frame pipeline。页面中的 SVG 为本站重新绘制,用于教学说明。
典型应用电路
SCHEMATIC关键波形 / 时序
WAVEFORM读完要能回答
CHECK 01
为什么 GPU 更适合并行任务?
CHECK 02
显存容量和显存带宽有什么区别?
CHECK 03
CPU 与 GPU 分工通常是什么?
CHECK 04
数据从 CPU 内存搬到 GPU 显存为什么会影响性能?
术语拆解
显存
GPU 专用或共享的高速图形/计算数据存储区域。
着色器
GPU 上执行图形或通用计算的小程序。
帧缓冲
保存即将显示到屏幕上的图像数据的区域。
并行计算
把任务拆成许多可同时执行的小任务。
和下一个节点的关系
GPU 性能强但耗电也高,整机稳定离不开电源。电源会把外部电能变成各部件需要的稳定电压。
