CUDA 3.0正式发布。下载链接。一些新的features(来自release notes,按照惯例稍微评论一下):
- 新的API:
- Half float(float16)纹理支持
对一些精度要求不高的算法,可以copy更多的数据到显卡了,比如CT重见算法,已经有人写paper证明了:) - double3 double4 矢量类型支持
没啥可说的了,就新的支持 - 一维的设备到设备的拷贝支持streams了
(确实没有感觉到stream的好处,之前折腾过一段,效果不明显) - 二进制ELF支持
- Concurrent Kernels(通过CU_DEVICE_ATTRIBUTE_CONCURRENT_KERNELS 这个属性值才查看)
貌似这个比较关键,也比较好,只是实际用起来不知道效果如何? - 批量的2D 3D FFT支持
不做评论,暂时没有用到
- 新的Toolkit功能增加
- Nvcc的–host-compilation=C选项没有了
这个没啥说的,难道这就是Nvidia说的原生的C++支持??? - Window下cuda的DLL命名规定,也就是规范了下cudart.dll的名字,允许使用多个cudart了。比如cudart32_30_4.dll 就是32位3.0版的dll了,4是编译的个数??唉不会想那些vc运行库那样把
- 将模拟器模式从cudart.dll单独分离出来了,以后用模拟器就要用cudaemu了
- CUBLAS 新的函数
没用到,不关注