文章关键字 ‘sdk’

CUDA 3.0正式发布

2010年03月20日,星期六

CUDA 3.0正式发布。下载链接。一些新的features(来自release notes,按照惯例稍微评论一下):

    新的API:

  • Half float(float16)纹理支持
    对一些精度要求不高的算法,可以copy更多的数据到显卡了,比如CT重见算法,已经有人写paper证明了:)
  • double3 double4 矢量类型支持
    没啥可说的了,就新的支持
  • 一维的设备到设备的拷贝支持streams了
    (确实没有感觉到stream的好处,之前折腾过一段,效果不明显)
  • 二进制ELF支持
  • Concurrent Kernels(通过CU_DEVICE_ATTRIBUTE_CONCURRENT_KERNELS 这个属性值才查看)
    貌似这个比较关键,也比较好,只是实际用起来不知道效果如何?
  • 批量的2D 3D FFT支持
    不做评论,暂时没有用到
    新的Toolkit功能增加

  • Nvcc的–host-compilation=C选项没有了
    这个没啥说的,难道这就是Nvidia说的原生的C++支持???
  • Window下cuda的DLL命名规定,也就是规范了下cudart.dll的名字,允许使用多个cudart了。比如cudart32_30_4.dll 就是32位3.0版的dll了,4是编译的个数??唉不会想那些vc运行库那样把
  • 将模拟器模式从cudart.dll单独分离出来了,以后用模拟器就要用cudaemu了
  • CUBLAS 新的函数
    没用到,不关注

(全文 …)

CUDA 3.0

2009年11月6日,星期五

The CUDA Toolkit 3.0 Beta is now available to GPU Computing registered
developers