显卡常见问题

散片机0算力故障问题

故障原因:

由于某张或者某几张卡算力为0 ,导致整机算力为0。


故障判断:

主机详情-远程命令-挖矿日志中,找到GPU算力为0 的显卡编号。


预处理方案:

主机详情-信息中,对该卡进行禁用操作,重启挖矿即可生效,这样操作后可保证其他卡正常工作。



解决方案:

优先使用系统层解决方案,系统层无法解决转入硬件层解决方案。


系统层解决方案:

针对相同类型、相同颗粒的显卡,设置多个挖矿模板,在超频参数处设置档位差:

第一类超频参数:保持其他参数不便,在电压处设置多档。

第二类超频参数:降低显存频率提高电压,设置多档。

优先使用第一类超频参数,如果问题依然存在,转入第二类超频参数。当矿机稳定工作时,再根据当前的超频参数进行微调,来达到当前显卡的最佳性能。


硬件层解决方案:

软件层无法解决的问题,就可以判断出问题出在硬件层,由于当前矿场都是散片机,受环境因素影响线路老化和金手指氧化速度较快。

解决方案为清理显卡金手指,而后更换转接线、转接卡槽。

 

已验证的解决方案:

经过调试,系统层无法解决的问题在经过硬件处理(更换转接线)后,已经得到了解决,并且算力已经恢复稳定工作24小时以上。

遇到此类问题,请参照此方法进行处理。

单卡算力低问题
显卡温度511℃
6卡矿机重启后只能识别到5卡情况
如何跑原VBIOS参数
显卡温度为灰色
设置集显启动怎么设置?
CPU核心数量不对
云端提示挖矿异常、CPU使用率突增、显卡温度为-1
N卡挖矿过程中显卡温度显示为-1℃算力掉为0