如何在code blocks上编程数的立方(用Codeblocks进行OpenCL编程5)
如何在code blocks上编程数的立方(用Codeblocks进行OpenCL编程5)
上节的向量相加是一维数组的并行运算,比较好理解。这节我们来看个4 X 4二维数组并行运算:矩阵转置。 4X4矩阵我们采用二维数组进行存储,在程序设计上,转置过程是16个数同时转置完成。注意这里的OpenCL的工作维数是二维。
1、transposition.cl代码如何在code blocks上编程数的立方(用Codeblocks进行OpenCL编程5)
上节的向量相加是一维数组的并行运算,比较好理解。这节我们来看个4 X 4二维数组并行运算:矩阵转置。 4X4矩阵我们采用二维数组进行存储,在程序设计上,转置过程是16个数同时转置完成。注意这里的OpenCL的工作维数是二维。
1、transposition.cl代码