<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>GPGPU.ORG.CN</title>
	<atom:link href="http://gpgpu.org.cn/feed" rel="self" type="application/rss+xml" />
	<link>http://gpgpu.org.cn</link>
	<description>Another GPGPU Blog...</description>
	<lastBuildDate>Thu, 03 Jun 2010 03:57:29 +0000</lastBuildDate>
	<language>zh</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Larrabee的新马甲</title>
		<link>http://gpgpu.org.cn/news/larrabees-new-mask</link>
		<comments>http://gpgpu.org.cn/news/larrabees-new-mask#comments</comments>
		<pubDate>Thu, 03 Jun 2010 03:57:29 +0000</pubDate>
		<dc:creator>annkok</dc:creator>
				<category><![CDATA[News]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/?p=332</guid>
		<description><![CDATA[http://www.intel.com/pressroom/archive/releases/2010/20100531comp.htm Random PostsIBM停止CELL开发坑，又少了一个。原文 update:好像是说停止了相关sdk的开发，转向了opencl，这点和前几...Larrabee杯具了Intel说larrabee要以软件平台的形式发布了，至于实体...等吧。 Nvidia和ATI又...一种简单的GPU三维图像分割算法一个用于三维灰度图像CCL算法最简单的实现，将算法的过程分为并行和串行两部分，分别放在GPU上和CP...AMD/ATI 发布Stream SDK 2.0正式版详细报道： Link1 Link 2 官方下载 大致看了以下，依旧没有提供对image的支持...Matlab下的CUDA编程(二)Matlab With CUDA(2)Matlab下通过Mex文件编写C程序 本节参考NVIDIA网站相关资源，点击此处链接： 1...]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/news/larrabees-new-mask/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>AMD OpenCL 2.1 SDK发布</title>
		<link>http://gpgpu.org.cn/opencl/amd-release-stream-sdk2-1</link>
		<comments>http://gpgpu.org.cn/opencl/amd-release-stream-sdk2-1#comments</comments>
		<pubDate>Mon, 03 May 2010 14:52:18 +0000</pubDate>
		<dc:creator>annkok</dc:creator>
				<category><![CDATA[News]]></category>
		<category><![CDATA[OpenCL]]></category>
		<category><![CDATA[amd]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/?p=329</guid>
		<description><![CDATA[AMD发布了2.1版的OpenCL SDK，下载链接，增加了： Support for openSUSE 11.2 and Red Hat Enterprise Linux 5.4. Support for OpenCL / OpenGL interoperability. Support for OpenCL byte addressable stores. Support for OpenCL™ images. Extension: Support for double-precision floating point basic arithmetic in OpenCL C kernels. Extension: Support for AMD media operations in OpenCL. Extension: Support for device fission in OpenCL. [...]]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/opencl/amd-release-stream-sdk2-1/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>cuda Array 拷贝问题</title>
		<link>http://gpgpu.org.cn/cuda/cuda-array-cop</link>
		<comments>http://gpgpu.org.cn/cuda/cuda-array-cop#comments</comments>
		<pubDate>Mon, 03 May 2010 08:34:07 +0000</pubDate>
		<dc:creator>wy</dc:creator>
				<category><![CDATA[CUDA]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/?p=327</guid>
		<description><![CDATA[今天作者在使用cudaMemcpyArrayToArray函数时发现其效率极低，如果使用如下代码，需要77ms cudaMemcpyArrayToArray&#40;d_Array_A, 0, 0, d_Array_B, 0, 0, nFrameSize*sizeof&#40;float&#41;&#41;; 如果开辟一块显存中转一下，效率会大幅提高，到20ms cudaMemcpyFromArray&#40;d_pfData, d_Array_B, 0,0,nFrameSize*sizeof&#40;float&#41;,cudaMemcpyDeviceToDevice&#41;; cudaMemcpyToArray&#40;d_Array_A, 0, 0, d_pfData, nFrameSize*sizeof&#40;float&#41;, cudaMemcpyDeviceToDevice&#41;; 纹理内存与全局内存之间有缓存，所以数据交换较快可以理解，但纹理内存之间拷贝速度反而更慢则不能理解。估计是cuda内部实现时没有做好优化。 Related PostsMatlab下的CUDA编程(四)Matlab With CUDA(4)第三节中我们介绍了NVIDIA的工程师写的编译脚本，但是这个脚本配置起来麻烦，用的时候选项也过于复杂...Matlab下的CUDA编程(三)Matlab With CUDA(3)根据第二节的介绍，matlab中可以通过mex文件的方式编译C/C++代码，但是对于.cu文件则无能...CUDA 3.0正式发布CUDA 3.0 ReleaseCUDA 3.0正式发布。下载链接。一些新的features（来自release notes，按照惯...Matlab下的CUDA编程(二)Matlab With CUDA(2)Matlab下通过Mex文件编写C程序 本节参考NVIDIA网站相关资源，点击此处链接： 1...Matlab下的CUDA编程(一)Matlab With CUDA(1)引言 Matlab作为科学计算中的重要工具，它提供了丰富的基本函数和工具箱，从而在各个领域得到...]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/cuda/cuda-array-cop/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Matlab下的CUDA编程(四)</title>
		<link>http://gpgpu.org.cn/cuda/matlab_with_cuda_4</link>
		<comments>http://gpgpu.org.cn/cuda/matlab_with_cuda_4#comments</comments>
		<pubDate>Wed, 07 Apr 2010 12:09:05 +0000</pubDate>
		<dc:creator>wy</dc:creator>
				<category><![CDATA[Application]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[matlab]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/uncat/matlab%e4%b8%8b%e7%9a%84cuda%e7%bc%96%e7%a8%8b%e5%9b%9b</guid>
		<description><![CDATA[第三节中我们介绍了NVIDIA的工程师写的编译脚本，但是这个脚本配置起来麻烦，用的时候选项也过于复杂。后来随着GPGPU的发展，CUDA逐渐被重视，因此MathWorks的工程师们重新写了这个nvmex脚本。毕竟是科班出身，新的脚本配置容易，使用简单。详细情况可访问其网站。在上述网站中，可找到下载nvmex源码的链接。下载后解压，得到nvmex.m。对其中的两个选项（红色部分按实际路径修改）稍加编辑，即可使用： CUDA_LIB_Location = &#8216;C:\CUDA\lib&#8217;; Host_Compiler_Location = &#8216;-ccbin &#34;C:\Program Files\Microsoft Visual Studio 8\VC\bin&#34;&#8216;; 修改之后，将其复制到addMatrix.cu相同目录，并将此目录设置为matlab运行目录，在命令窗口输入： &#62;&#62; nvmex(&#8216;addMatrix.cu&#8217;); 即可完成编译。编译成功后，在matlab中即可像常规函数一样使用addMatrix函数。 Related PostsMatlab下的CUDA编程(三)Matlab With CUDA(3)根据第二节的介绍，matlab中可以通过mex文件的方式编译C/C++代码，但是对于.cu文件则无能...Matlab下的CUDA编程(二)Matlab With CUDA(2)Matlab下通过Mex文件编写C程序 本节参考NVIDIA网站相关资源，点击此处链接： 1...Matlab下的CUDA编程(一)Matlab With CUDA(1)引言 Matlab作为科学计算中的重要工具，它提供了丰富的基本函数和工具箱，从而在各个领域得到...cuda Array 拷贝问题cuda Array copy今天作者在使用cudaMemcpyArrayToArray函数时发现其效率极低，如果使用如下代码，需...CUDA 3.0正式发布CUDA 3.0 ReleaseCUDA 3.0正式发布。下载链接。一些新的features（来自release notes，按照惯...]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/cuda/matlab_with_cuda_4/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Matlab下的CUDA编程(三)</title>
		<link>http://gpgpu.org.cn/cuda/matlab_with_cuda_3</link>
		<comments>http://gpgpu.org.cn/cuda/matlab_with_cuda_3#comments</comments>
		<pubDate>Wed, 07 Apr 2010 05:31:19 +0000</pubDate>
		<dc:creator>wy</dc:creator>
				<category><![CDATA[CUDA]]></category>
		<category><![CDATA[matlab]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/uncat/matlab%e4%b8%8b%e7%9a%84cuda%e7%bc%96%e7%a8%8b%e4%b8%89</guid>
		<description><![CDATA[根据第二节的介绍，matlab中可以通过mex文件的方式编译C/C++代码，但是对于.cu文件则无能为力。为了解决这个问题，NV的工程师们开发了用于编译cu文件的脚本，下面进行详细介绍。 测试环境：vs2005, matlab 7.6(r2008a), cuda 2.3 首先在NV的网站http://developer.nvidia.com/object/matlab_cuda.html下载matlab的插件包，并解压，共有4个重要文件： nvmex.m nvmex_helper.m nvmexopts.bat .\bin\nvmex.pl 首先将nvmex.pl拷贝到matlab的安装目录中的bin目录下，例如笔者的系统中就拷贝到C:\MATLAB\bin中。 下面编写cu文件，我们仍以两个矩阵相加为例，具体流程见代码注释。从代码中可看到，同时使用了matlab函数和cuda函数，并在GPU中完成了两个矩阵相加。完成addMatrix.cu的编写后，需要对其进行编译。 首先将nvmex.m,nvmex_helper.m,nvmexopts.bat拷贝到addMatrix.cu文件所在目录，并设置为matlab的当前目录。 在matlab命令窗口中运行: nvmex -setup，选择编译器，此处选择vs2005。 编辑nvmexopts.bat，修改其中的VSINSTALLDIR选项，指定为vs2005的安装目录，如笔者的系统中： C:\Program Files\Microsoft Visual Studio 8 编译命令： nvmex -f nvmexopts.bat addMatrix.cu -IC:\cuda\include -LC:\cuda\lib –lcudart 编译成功后，在matlab中即可像常规函数一样使用addMatrix函数。 可能会遇到的问题： 目录设置：需要仔细按照上述步骤设置好相关目录 编译时出现未定义的变量及结构，如_wchar等，则可更新nvmex.pl和nvmexopts.bat来解决。下载链接 /******************************************************************** filename: addMatrix.cu file ext: cu author: wy@gpgpu.org.cn purpose: test matlab with cuda by nvidia's nvmex *********************************************************************/ &#160; #include &#34;mex.h&#34; [...]]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/cuda/matlab_with_cuda_3/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>OpenCL Studio 1.0 beta released</title>
		<link>http://gpgpu.org.cn/opencl/opencl-studio-1-0-beta-released</link>
		<comments>http://gpgpu.org.cn/opencl/opencl-studio-1-0-beta-released#comments</comments>
		<pubDate>Wed, 07 Apr 2010 03:04:30 +0000</pubDate>
		<dc:creator>wy</dc:creator>
				<category><![CDATA[Application]]></category>
		<category><![CDATA[OpenCL]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/uncat/opencl-studio-1-0-beta-released</guid>
		<description><![CDATA[Geist Software Labs has released the first version of OpenCL Studio for beta testing. OpenCL Studio combines OpenCL and OpenGL into a single integrated development environment that allows you to visualize OpenCL computation using powerful 3D rendering techniques. The editor hides much of the complexity of the underlying APIs while still providing flexibility via the [...]]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/opencl/opencl-studio-1-0-beta-released/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>CUDA 3.0正式发布</title>
		<link>http://gpgpu.org.cn/cuda/cuda-3-0-release</link>
		<comments>http://gpgpu.org.cn/cuda/cuda-3-0-release#comments</comments>
		<pubDate>Sat, 20 Mar 2010 07:10:33 +0000</pubDate>
		<dc:creator>annkok</dc:creator>
				<category><![CDATA[CUDA]]></category>
		<category><![CDATA[News]]></category>
		<category><![CDATA[sdk]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/?p=277</guid>
		<description><![CDATA[CUDA 3.0正式发布。下载链接。一些新的features（来自release notes，按照惯例稍微评论一下)： 新的API： Half float(float16)纹理支持 对一些精度要求不高的算法，可以copy更多的数据到显卡了，比如CT重见算法，已经有人写paper证明了:) double3 double4 矢量类型支持 没啥可说的了，就新的支持 一维的设备到设备的拷贝支持streams了 （确实没有感觉到stream的好处，之前折腾过一段，效果不明显) 二进制ELF支持 Concurrent Kernels（通过CU_DEVICE_ATTRIBUTE_CONCURRENT_KERNELS 这个属性值才查看) 貌似这个比较关键，也比较好，只是实际用起来不知道效果如何？ 批量的2D 3D FFT支持 不做评论，暂时没有用到 新的Toolkit功能增加 Nvcc的&#8211;host-compilation=C选项没有了 这个没啥说的，难道这就是Nvidia说的原生的C++支持？？？ Window下cuda的DLL命名规定，也就是规范了下cudart.dll的名字，允许使用多个cudart了。比如cudart32_30_4.dll 就是32位3.0版的dll了，4是编译的个数？？唉不会想那些vc运行库那样把 将模拟器模式从cudart.dll单独分离出来了，以后用模拟器就要用cudaemu了 CUBLAS 新的函数 没用到，不关注 一些小的knowledge(记在这里以供查询把)： 在XP以上windows系统下： 如果在非tesla的GPU下用cuda，必须把windows桌面扩展到这个GPU上或者把这个先看作为PhyX的GPU 也就是说你要有两个GPU的话，只能用那个绘制windows桌面的那个啦，为了tesla出货，这招够狠 kernel运行被限制在2s以内啦，如果超过2s，就要触发windows的TDR(Timeout Detection and Recovery)机制了, 具体看 http://www.microsoft.com/whdc/device/display/wddm_timeout.mspx. cuda profiler在vista下不支持性能计数 cudamalloc最大分配内存是MIN ((系统内存(MB)-512 (MB)) / 2, PAGING_BUFFER_SEGMENT_SIZE),vista下面PAGING_BUFFER_SEGMENT_SIZE 大概是2GB XP下面的： 在显示用的GPU上一个kernel最多运行5s，超过这个时间就launch failed了，所以nvidia就建议你两个显卡了一个计算一个显示(真可以啊) 所有的windows下面： 就是你查询到GPU设备的id可能是会变化的，所以你要查询所有的gpu设备，然后设置合适的那个，而不是简单设置id为0的或者id为1的 [...]]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/cuda/cuda-3-0-release/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Matlab下的CUDA编程(二)</title>
		<link>http://gpgpu.org.cn/cuda/matlab_with_cuda_2</link>
		<comments>http://gpgpu.org.cn/cuda/matlab_with_cuda_2#comments</comments>
		<pubDate>Mon, 22 Feb 2010 04:06:56 +0000</pubDate>
		<dc:creator>wy</dc:creator>
				<category><![CDATA[Application]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[matlab]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/uncat/matlab%e4%b8%8b%e7%9a%84cuda%e7%bc%96%e7%a8%8b%e4%ba%8c</guid>
		<description><![CDATA[Matlab下通过Mex文件编写C程序 本节参考NVIDIA网站相关资源，点击此处链接： 1、MEX规则 Matlab提供了MEX文件的方式来支持C/C++代码编写的算法。mex文件需要满足如下要求： (1) 包含mex.h头文件 (2) 函数名称、参数返回值必须为如下形式: void mexFunction&#40;int nlhs, mxArray *plhs&#91;&#93;,int nrhs, const mxArray *prhs&#91;&#93;&#41;; 其中： nlhs 为输出数组个数(Left Hand Side) plhs 为指向输出数组的指针 nrhs 为输入数组个数(Right Hand Side) prhs 为指向输入数组的指针，且输入数组只读。 以上四个变量，是在C/C++代码中唯一可用到的变量。实际上，由于matlab中所有的变量都是mxArray结构(向量，数组，字符串。。。)，因此常见的数据类型均可放入mxArray传递给程序进行处理。 (3)常用mex函数: a. mex函数定义在mex.h(./extern/include)中，并以mex为前缀，例如打印输出的mexPrintf()函数、在mex文件中调用matlab函数的mexCallMATLAB()函数等。 b. 在matrix.h(./extern/include)中定义了mxArray结构以及对矩阵操作的函数，如创建双精度矩阵的mxCreateDoubleMatrix()、从mxArray中获取数据指针mxGetPr()等。 (4)编译 首先可以通过mex -setup来选择编译器，此时matlab会提示： Would you like mex to locate installed compilers [y]/n? 此处如果选y，则会列出系统中安装的编译器，但不一定完整（作者就遇到这样的情况）。如果选n，则会列出matlab支持的所有编译器， 我们按实际情况选取即可（按照CUDA的要求，vs2005以上）。 另外常用的编译选项有： -I 增加头文件(.h)包含目录 -L 增加库文件(.lib)包含目录 [...]]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/cuda/matlab_with_cuda_2/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Matlab下的CUDA编程(一)</title>
		<link>http://gpgpu.org.cn/cuda/matlab_with_cuda_1</link>
		<comments>http://gpgpu.org.cn/cuda/matlab_with_cuda_1#comments</comments>
		<pubDate>Thu, 04 Feb 2010 07:50:11 +0000</pubDate>
		<dc:creator>wy</dc:creator>
				<category><![CDATA[Application]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[matlab]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/cuda/matlab下的cuda编程一</guid>
		<description><![CDATA[引言 Matlab作为科学计算中的重要工具，它提供了丰富的基本函数和工具箱，从而在各个领域得到了广泛的应用。但Matlab的缺点是代码效率较低，在工程应用中只能作为模型验证，而不能得到实际应用。而CUDA作为显卡编程比较成熟的语言，能够充分利用GPU的计算能力，提高执行效率。因此如何能将CUDA的高效与matlab的简便有机的结合是本文要解决的问题，根据解决问题的方式我们将分为两节进行讲解。 Related PostsMatlab下的CUDA编程(四)Matlab With CUDA(4)第三节中我们介绍了NVIDIA的工程师写的编译脚本，但是这个脚本配置起来麻烦，用的时候选项也过于复杂...Matlab下的CUDA编程(三)Matlab With CUDA(3)根据第二节的介绍，matlab中可以通过mex文件的方式编译C/C++代码，但是对于.cu文件则无能...Matlab下的CUDA编程(二)Matlab With CUDA(2)Matlab下通过Mex文件编写C程序 本节参考NVIDIA网站相关资源，点击此处链接： 1...cuda Array 拷贝问题cuda Array copy今天作者在使用cudaMemcpyArrayToArray函数时发现其效率极低，如果使用如下代码，需...CUDA 3.0正式发布CUDA 3.0 ReleaseCUDA 3.0正式发布。下载链接。一些新的features（来自release notes，按照惯...]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/cuda/matlab_with_cuda_1/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>AMD/ATI 发布Stream SDK 2.0正式版</title>
		<link>http://gpgpu.org.cn/opencl/amd-release-stream-sdk2</link>
		<comments>http://gpgpu.org.cn/opencl/amd-release-stream-sdk2#comments</comments>
		<pubDate>Tue, 22 Dec 2009 18:03:42 +0000</pubDate>
		<dc:creator>annkok</dc:creator>
				<category><![CDATA[News]]></category>
		<category><![CDATA[OpenCL]]></category>
		<category><![CDATA[amd]]></category>

		<guid isPermaLink="false">http://gpgpu.org.cn/?p=241</guid>
		<description><![CDATA[详细报道： Link1 Link 2 官方下载 大致看了以下，依旧没有提供对image的支持，不过好歹增加了对dx和opengl的互操作。 根据之前测试版的经验，对性能提升不太报希望(ps 之前测试性能竟然和brook+实现在一个级别,比较汗的说）。 基于CT重建的性能测试稍候提供。 Related PostsAMD OpenCL 2.1 SDK发布amd-release-stream-sdk2.1AMD发布了2.1版的OpenCL SDK，下载链接，增加了： Support for op...AMD 发布OpenCL GPU实现近日AMD也发布了其GPU的opencl实现，第一时间去测试了一般，很遗憾，在NV的实现可以运行的代...OpenCL BenchmarkAMD和Sisoft联合在Sisoft的Sandra 2010里面添加了opencl benchma...OpenCL系列(四)-Memory本文将介绍Opencl中的各种存储类型和如何创建和使用它们。...IBM停止CELL开发坑，又少了一个。原文 update:好像是说停止了相关sdk的开发，转向了opencl，这点和前几...]]></description>
		<wfw:commentRss>http://gpgpu.org.cn/opencl/amd-release-stream-sdk2/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
