关于多GPU并行运算核心不能同步的问题

来源:百度知道 编辑:UC知道 时间:2024/05/29 09:41:31
我的系统有4个295,用CUDA做计算。目前的问题是:程序启动8个线程,每一个线程都对应一个kernel程序并且对应一个显卡核心,但是8个显卡核心并没有同时运算,大概有6-7个核心同步运算,有1-2个总是等待其他6-7个核心运算完成后,再开始运算,导致kernel不能同步。

主板:华硕P6T7,内存8G,4个XFX的295
请问有谁遇到过类似的问题呢?多谢啦!

P6T7有2个nv200的控制器,可以提供2倍的pci-e带宽。所以一般应用的话4个单芯显卡都是可以应付的。但4个295就不好说了... 或许只能插3个(相当于6块),我估计要3个nv200的控制器才行了... 主板还是不够强悍啊!

这位同学,如此高档的问题在baidu知道这种地方几乎是不可能求得答案的。

我怀疑是PCI-E总线控制器通道数被三块显卡挤满了,导致剩下的要排队等待。

还有,俺玩不起CUDA并行计算,只能搜罗点机房的旧机器搞beowulf集群。

用GPU并行了?楼主哪个学校的?好强悍阿。