关注于视频技术领域的相关资讯,研发和产品
标签 Tag : 并行

NVIDIA CUDA通用并行计算架构

2009-06-06 开发 发表评论 查看(1,080)

最近在学习NVIDIA的CUDA通用并行计算架构, 该架构是利用NVIDIA的GPU进行计算密集型、高度并行化的计算. 有兴趣的读者可以参见NVIDIA CUDA中文网英文网.
在学习的过程中,该并行架构的编程原理给我的感觉还算好理解, 主要的流程就是:

  1. Host (aka. CPU) 进行初始化程序及Host上的内存数据
  2. Host 将其内存区上的数据拷贝到Device (aka. GPU)的内存区
  3. 执行Device上的代码 (aka. Kernal函数)进行并行计算
  4. Device上的计算结束后,再将Device的内存区的数据拷贝回Host的内存区
  5. Host再进行后续代码工作

因此Hos[......]

继续阅读

本文来自: NVIDIA CUDA通用并行计算架构