主流魔改卡和计算卡的浮点性能表
单精度浮点性能(FP32)可以对应游戏性能,半精度浮点性能(FP16)和整数性能(INT8)可以对应AI计算性能,受限于游戏和软件优化,还有显卡的功耗影响,实际性能差别会比较大,所以该表仅供参考。( ❌ 代表该项浮点性能被阉割或者理论性能过低,可以忽略不计)
GTX 10XX系的显卡的半精度浮点性能(FP16)约为单精度浮点性能(FP32)的64分之一,基本不能进行AI计算,仅GP100核心的显卡保留有完整的半精度浮点性能(FP16)
RTX 20XX系和GTX 16XX系的显卡的半精度浮点性能(FP16)约为单精度浮点性能(FP32)的2倍
RTX 30XX系以及之后的半精度浮点性能(FP16)和单精度浮点性能(FP32)相同(A100之类的计算卡除外),整数性能(INT8)约等于半精度浮点性能(FP16)的2~4倍,所以跑AI的同学建议优先选择架构最新的N卡
| 型号 | 半精度性能(FP16) | 单精度性能(FP32) |
|---|---|---|
| CMP 50HX至170HX | ❌ | ❌ |
| GTX 850M | ❌ | 1.154 TFLOPS |
| GTX 1050M | ❌ | 1.911 TFLOPS |
| Tesla M4 | ❌ | 2.195 TFLOPS |
| P106-90 | ❌ | 2.352 TFLOPS |
| P106M | ❌ | 2.974 TFLOPS |
| GTX 1650Ti M | 6.083 TFLOPS | 3.041 TFLOPS |
| Tesla K20/K20m/K20c | ❌ | 3.524 TFLOPS |
| Tesla K20x | ❌ | 3.935 TFLOPS |
| Tesla K80 | ❌ | 4.113 TFLOPS X2 |
| GTX 1060M | ❌ | 4.278 TFLOPS |
| P106-100 | ❌ | 4.375 TFLOPS |
| NVIDIA A2 | 4.531 TFLOPS | 4.531 TFLOPS |
| RTX 2060M | 9.216 TFLOPS | 4.608 TFLOPS |
| Tesla M60 | ❌ | 4.825 TFLOPS X2 |
| GTX 1660Ti M | 9.769 TFLOPS | 4.884 TFLOPS |
| GTX 980 | ❌ | 4.981 TFLOPS |
| CMP 30HX | ❌ | 5.027 TFLOPS |
| Tesla K40/K40c | ❌ | 5.046 TFLOPS |
| RTX 3050M | 5.501 TFLOPS | 5.501 TFLOPS |
| RTX 3000M | 10.60 TFLOPS | 5.299 TFLOPS |
| Tesla P4 | ❌ | 5.704 TFLOPS |
| RTX 2070M | 13.27 TFLOPS | 6.636 TFLOPS |
| P104-100 | ❌ | 6.655 TFLOPS |
| GTX 1070M | ❌ | 6.738 TFLOPS |
| Tesla M40 | ❌ | 6.832 TFLOPS |
| AMD BC160 | 14.75 TFLOPS | 7.373 TFLOPS |
| CMP 40HX | ❌ | 7.603 TFLOPS |
| RTX 4000M | 15.97 TFLOPS | 7.987 TFLOPS |
| Tesla T4 | 65.13 TFLOPS | 8.141 TFLOPS |
| RTX A2000M | 8.637 TFLOPS | 8.637 TFLOPS |
| GTX 1080M | ❌ | 8.878 TFLOPS |
| GTX 1080 | ❌ | 8.873 TFLOPS |
| RTX 4050M | 8.986 TFLOPS | 8.986 TFLOPS |
| RTX 2080M | 18.72 TFLOPS | 9.362 TFLOPS |
| RTX 5000M | 18.80 TFLOPS | 9.400 TFLOPS |
| Tesla P100 | 19.05 TFLOPS | 9.526 TFLOPS |
| RTX A3000M | 10.08 TFLOPS | 10.08 TFLOPS |
| P102-100 | ❌ | 10.77 TFLOPS |
| RTX 3060M | 10.94 TFLOPS | 10.94 TFLOPS |
| RTX 4060M | 11.61 TFLOPS | 11.61 TFLOPS |
| Tesla P40 | ❌ | 11.76 TFLOPS |
| AMD MI25 | 24.58 TFLOPS | 12.29 TFLOPS |
| AMD MI50 | 26.82 TFLOPS | 13.41 TFLOPS |
| Tesla V100 | 28.26 TFLOPS | 14.13 TFLOPS |
| RTX 4070M | 15.62 TFLOPS | 15.62 TFLOPS |
| RTX 3070M | 15.97 TFLOPS | 15.97 TFLOPS |
| RTX 3080M | 18.98 TFLOPS | 18.98 TFLOPS |
| RTX A5000M | 19.35 TFLOPS | 19.35 TFLOPS |
| RTX 4080M | 24.72 TFLOPS | 24.72 TFLOPS |
| NVIDIA L4 | 30.29 TFLOPS | 30.29 TFLOPS |
移动端魔改显卡
移动端魔改卡使用的核心为移动端,也就是笔记本主板的芯片,大部分为笔记本主板拆机或者其他非正规渠道,戴尔惠普OEM RTX3000官方魔改卡则是自己的正规渠道芯片
移动端魔改卡的特点:由于笔记本的风扇调速是通过EC和主板的BIOS控制,与桌面端通过VBIOS控制不同,所以魔改卡的风扇大部分只能定速,无法调速,噪音较高,或者风扇接口只能插到主板上通过主板调速,戴尔惠普OEM RTX3000官方魔改卡,部分魔改卡也会通过增加温控电路实现调速,
移动端魔改卡在桌面端也是需要VBIOS控制的,但是魔改卡厂商能力有限,VBIOS兼容性问题很多,比如RTX3000和RTX3060m等部分魔改卡在铭瑄,华硕的主板上无法正常使用,会出现黑屏点不亮,驱动无法安装等情况
| 型号 | |
|---|---|
| GTX 850M | 移动端GTX850核心,性能与GTX750ti相近 |
| GTX 1050M | 移动端GTX1050核心,性能与GTX1050相近 |
| GTX 1060M | 移动端GTX1060核心,性能与GTX1060相近 |
| GTX 1070M | 移动端GTX1070核心,性能与GTX1070相近 |
| GTX 1080M | 移动端GTX1080核心,性能与GTX1070相近 |
| GTX 1650ti M | 移动端GTX1650ti核心,性能与GTX1650ti相近 |
| GTX 1660ti M | 移动端GTX1660ti核心,性能与GTX1660ti相近 |
| RTX 2060M | 移动端RTX2060核心,性能与RTX2060差距较大,与GTX1660相近 |
| RTX 2070M | 移移动端RTX2070核心,性能与RTX2060相近 |
| RTX 2080M | 移移动端RTX2080核心,性能与RTX2070Super相近 |
| RTX 3000 | 移动端RTX3000核心,性能与GTX1660Super相近 |
| RTX 4000 | 移动端RTX4000核心,性能与RTX2060Super相近 |
| RTX 5000 | 移动端RTX5000核心,性能与RTX2070Super相近 |
| RTX A2000M | 移动端RTX A2000核心,性能与RTX3050相近 |
| RTX A3000M | 移动端RTX A3000核心,性能与GTX1660ti相近 |
| RTX A5000M | 移动端RTX A5000核心,性能与RTX3070相近 |
| RTX 3050M | 移动端RTX3050核心,性能与GTX1650相近 |
| RTX 3060M | 移动端RTX3060核心,性能与RTX2060相近 |
| RTX 3070M | 移动端RTX3070核心,性能与RTX3060ti相近 |
| RTX 3080M | 移动端RTX3080核心,性能与RTX3070相近 |
| RTX 4050M | 移动端RTX4050核心,性能与GTX1660Super相近 |
| RTX 4060M | 移动端RTX4060核心,性能与RTX2060相近 |
| RTX 4070M | 移动端RTX4070核心,性能与RTX2060相近 |
| RTX 4080M | 移动端RTX4070核心,性能与RTX3070ti相近 |
以上表格仅为参考,实际型号更多,不同显存容量和功耗性能也差距较大
移动端魔改显卡的驱动安装指南
1,使用国外作者arutar的魔改驱动
2,根据教程手打驱动
- 到英伟达官网下载驱动,点击进入官网,型号随意选择,下载最新版的驱动即可
- 不要安装,用解压缩软件将下载来的驱动安装包进行解压
- 打开文件资源管理器,在 此电脑 上右键,选择 显示更多选项 ,然后点击 管理,进入到
设备管理器->显示适配器 - 找到 Microsoft基本显示适配器 然后鼠标右键 更新驱动程序
- 选择下方的,浏览我的电脑以查找驱动程序
- 继续选择下方的,让我从计算机上可用驱动列表中选取
- 取消勾选 显示兼容硬件
- 然后点击右下角的 从磁盘安装,浏览 -> 找到之前解压缩后的驱动目录 -> 找到Display.Driver目录
-> 随便选一个文件 -> 确定 - 等待出现型号列表,找到自己显卡对应的型号,然后点击下一步,确定之后即可安装成功
如果以上方法均安装失败,并排除掉铭瑄,华硕主板的兼容性问题之后,那么你的显卡可能是ES核心的锁驱卡或者坏卡
锁驱动显卡
锁驱动显卡使用的核心为ES(Engineering Sample)工程样品核心或者移动端的ES核心
锁驱动显卡:因为是ES的核心,所以只能使用非常早期的驱动,不同批次的ES核心的性能会有差距
针对移动端+ES核心的锁驱魔改卡,可以按照上方的魔改卡的教程,尝试选择低版本的驱动安装
锁驱卡只是Windows锁驱,在Linux系统中可正常使用,推荐锁驱卡玩家使用Linux
| 型号 | |
|---|---|
| GTX980锁驱卡 | GTX980的ES核心,只能使用446以下的驱动 |
| GTX1080锁驱卡 | GTX1080的ES核心,只能使用377或441的驱动 |
锁驱卡根据对应的厂家寻找驱动即可
由于部分厂家已经倒闭,这里提供部分驱动下载,该驱动其他锁驱卡也可使用,比如1060 1070锁驱卡
百度网盘下载:GTX1080通用377和441驱动,提取码:6666
百度网盘下载:磐镭 小影霸GTX1080官方377.35驱动,提取码:6666
百度网盘下载:磐镭 小影霸GTX1080官方445.75驱动,提取码:6666
Tesla计算显卡
Tesla计算卡用于服务器计算用,和正常的Quadro专业卡相比,通常阉割了视频输出接口,且大部分依靠服务器风道散热,因此一般没有主动散热风扇
Tesla计算卡使用的驱动为TCC模式,也可通过nvidia-smi或者改注册表切换WDDM模式打游戏
Tesla计算卡的供电接口与CPU供电接口同样的EPS 8PIN接口而不是普通显卡的6+2PIN接口,所以需要转接线才能正常供电
| 型号 | |
|---|---|
| GRID K1 16G | 四颗GK107核心,虚拟化专用显卡,需要改散热 |
| GRID K2 8G | 两颗颗GK104核心,虚拟化专用显卡,需要改散热 |
| Tesla K20/K20m/K20s 5GB | GK110核心,可以焊接显示接口,需要改散热 |
| Tesla K20C 5GB | GK110核心,带主动散热风扇,可以焊接显示接口,只需要刷BIOS |
| Tesla K20X 6GB | GK110核心,可以焊接显示接口,需要改散热 |
| Tesla K40 12GB | GK180核心,可以焊接显示接口,需要改散热 |
| Tesla K40C 12GB | GK180核心,带主动散热风扇,可以焊接显示接口,只需要刷BIOS |
| Tesla K80 2x12GB | 两个GK210核心,300瓦功耗较高,可以焊接显示接口,需要改散热 |
| Tesla M4 4GB | GM206核心,仅50W功耗,无需外接供电,性能与GTX960相近,需要改散热 |
| Tesla M40 12GB | GM200核心,性能与GTX980ti相近,需要改散热 |
| Tesla M60 2x8GB | 两个GM204核心,300瓦功耗较高,需要改散热 |
| Tesla P4 8GB | GP104核心,仅75W功耗,无需外接供电,需要改散热 |
| Tesla P40 24GB | GP102核心,性能与GTX1080ti相近,需要改散热 |
| Tesla P100 16GB | GP100核心,HBM显存,有SXM2和PCIE两个版本,需要改散热 |
| Tesla V100 16GB | GV100核心,HBM显存,有SXM2和PCIE两个版本,在普通家用主板上会有掉驱动BUG,需要改散热 |
| Tesla T4 16GB | TU104核心,仅70W功耗,无需外接供电,半精度性能是单精度的8倍,需要改散热 |
| NVIDIA A2 16GB | GA107核心,仅60W功耗,无需外接供电,需要改散热 |
| NVIDIA L4 24GB | AD104核心,仅72W功耗,无需外接供电,需要改散热 |
Tesla计算显卡通过修改注册表解锁WDDM指南
最简单的方发,安装好驱动后直接使用WDDM解锁工具:Github地址
- 到英伟达官网下载驱动,点击进入官网,选择 Data Center / Tesla,找到自己对应的型号即可
- 按下 WIN + R 键,输入 regedit 打开注册表
- Computer -> HKEY_LOCAL_MACHINE -> SYSTEM -> CurrentControlSet -> Control -> Class -> {4d36e968-e325-11ce-bfc1-08002be10318}
- 确定输出卡和计算卡的正确序号,一般来说 0001 是核显,0002 是 Tesla显卡,但也可能相反
- 在 Tesla 卡(0002)下面操作:
- 修改:AdapterType,值从2修改为1
- 修改:FeatureScore,值从 CF 修改为 D1。(十六进制,hex)
- 新增:GridLicensedFeatures,类型为 DWORD(32bit),值为 7。(强制开启 GRID 模式)
- 新增:EnableMsHybrid,类型为 DWORD(32bit),值为 1。
- 在核显(0001)下面操作
- 新增:EnableMsHybrid,类型为 DWORD(32bit),值为 2。
- 重启电脑后查看任务管理器,如果能识别到第二个显卡则配置成功
Tesla计算卡刷BIOS指南
- 到Techpowerup寻找对应的BIOS并下载,点击进入VGA BIOS下载,下载的BIOS显存需要和显卡显存匹配,显存不一致会导致变砖
- 下载魔改版的nvflashhk进行强刷,Github下载地址
- 输入.\nvflashhk -6 .rom(是下载的BIOS的文件名)
- 如果没有报错,那么一般是刷成功了
- 如果已经对硬件进行修改并刷入TITAN之类的游戏卡BIOS,那么像正常显卡一样安装驱动即可,如果是只是超频或者降频之类的原BIOS,那么使用 WIN + R 输入 nvidia-smi.exe -dm 0 即可启动WDDM模式
挖矿专用显卡
挖矿专用显卡使用挖矿专用核心,通常阉割了视频输出与编解码功能,由于是在核心内部阉割,所以无法改装出显示接口,也无法进行视频解码和编码
CMP系列卡同时也阉割了RT core和Tensor core,在进行AI计算时无法正常正常使用FP16和INT8计算,比如Topaz Video AI速度会奇慢无比,使用CUDA或者Vulkan的项目大多正常,同时在游戏中无法开启光追和DLSS,部分游戏可以开启但会导致性能下降
挖矿专用显卡与Tesla计算卡一样,默认驱动是TCC模式,需要安装魔改驱动来解锁成正常游戏卡使用
PCIE1.1x16带宽等效于PCIE3.0X4,一般1080P游戏中不会出现传输瓶颈,游戏推荐P106,30HX,40HX这三张卡,由于CMP系列卡全系阉割了半精度,所以不适合拿来跑AI
| 型号 | |
|---|---|
| P106-90 3GB | GP106核心,性能与GTX1060 3G相近,PCIE最高只有1.1x4 |
| P106-100 6GB | GP106核心,性能与GTX1060 6G相近,PCIE最高只有1.1x16 |
| P104-100 8GB | GP104核心,性能与GTX1070相近,PCIE最高只有1.1x4 |
| P102-100 10GB | GP102核心,性能与GTX1080ti相近,PCIE最高只有1.1x4 |
| CMP 30HX 6GB | TU116核心,性能与GTX1660相近,Tensor Core和RT Core阉割,PCIE最高只有1.1x16 |
| CMP 40HX 8GB | TU106核心,性能与GTX2060Super以及AMD的BC160相近,Tensor Core和RT Core阉割,但是保留了编解码单元,PCIE最高只有1.1x16 |
| CMP 50HX至170HX | 全部阉割,仅保留了双精度浮点(FP64),导致游戏性能约等于无 |
| 型号 | |
|---|---|
| P106M 4GB | GP106核心,特斯拉车机流出的显卡,大多数是MXM接口,性能和1050Ti相近 |
挖矿专用显卡驱动安装指南
1,使用dartraiden的魔改驱动,显卡会被改名为对应的游戏卡型号,可以解锁视频编码的最大数量限制(仅限40HX和其他游戏卡)
2,使用RainCandy(雨糖)的魔改驱动
以上两个魔改驱动也支持部分移动端魔改显卡和Tesla计算卡
AMD魔改和计算显卡
由于AMD显卡兼容性始终差NVIDIA一截,官方驱动优化水平也比较差,维修困难等原因,AMD的魔改卡数量一直较少,好在AMD的魔改卡限制较少,PCIE带宽正常,浮点计算单元正常,只有部分卡的编解码被阉割,价格波动小,对于游戏,普通画图和渲染用户来说性价比还可以,使用AMD魔改显卡建议搭配第三方魔改驱动使用
除了魔改显卡以外,AMD还有很多OEM的奇怪核显/独显,这种平台大多没有驱动支持或者官方驱动支持不完善,如8809G,小霸王Z+,BC250等,对于这种平台优先使用Linux系统来获取更完善的驱动支持,或者使用第三方魔改驱动
R.ID驱动官网:https://www.rdn-id.com/
| 型号 | |
|---|---|
| FirePro S7150 8G | GCN3.0架构的Tonga核心,28NM,需要魔改散热,虚拟化专用卡,最小拆分显存512M,虚拟机可以拆分出16个显卡 |
| FirePro S7150 X2 16G | 两个S7150核心拼在一张主板上,最高拆分32个显卡 |
| MI25 16G | GCN5.0架构的VEGA10核心,14NM功耗较高,需要魔改散热,如果想解锁视频输出需要刷BIOS |
| MI50 16G/32G | GCN5.1架构的VEGA20核心,虽然是7NM但是功耗依然很高,需要魔改散热,如果想解锁视频输出需要刷BIOS |
| BC160 8G/16G | RNDA架构的NAVI 12核心,7NM制成,视频编解码能力被阉割,如果想解锁视频输出需要刷BIOS |
| BC250 16G | PS5同款核心,CPU是6核ZEN2,GPU是24 CU RDNA2(可解锁40CU),16G GDDR6统一内存 |
我最近想整个副机直播,我看英伟达游戏卡和专业卡和什么专用卡?还是啥。我也不懂。NVENC编码核心数量有差距。我在想搞直播推流能不能用什么特斯拉这些卡去搞?因为感觉性价比高点好像。但是我又不会整。😂
直播副机编码能力够强就行,性价比最高的就是两百元左右的英特尔DG1和Quadro P620,可以,具体的可以参考这个http://tisensen.cn/index.php/archives/59/