Jak jsem se napálil na bazoši aneb pokus o opravu VGA MSI GTX 970 GAMING 4G v1.1

      15.7.2022 Služby www.bazos.cz využívám spoustu let a dosud jsem neměl s prodejci ani kupci žádný problém, ale bohužel čas od času se objeví nějaký podvodník, který naruší důvěru a tak i já jsem se teď spálil při koupi VGA. Nejjednodušší podvod je, že za poslané peníze prostě nic nepošlou, tenhle zmrdeček sice poslal, ale vědomě nefunkční šrot. Bazoš důsledně neověřuje identitu uživatelů. Sice pro zadání inzerátu vyžaduje ověření telefonu přes SMS kód, ale do samotného inzerátu už lze napsat cokoliv. Bohužel jsem si nevšiml, že uživatel měl vyplněné neplatné číslo (musí se rozkliknout, aby se zobrazilo celé), neboť komunikuju převážně mailem (přes formulář odeslat odpověď). Zde je původní inzerát se všemi dostupnými údaji o prodejci, abyste se příp. kontaktu s ním mohli vyvarovat:

Inzerát 154895109: GTX 970
Naposledy funkční teď asi rok ve skříni. Nemám jak otestovat... Mám jen notebook.
Cena: 1299 Kč
Jméno: Pehe
Telefon: 123654789
Lokalita: 50002 Hradec Králové
E-mail: Physic5@seznam.cz
ID Zásilkovny: Z 118 8514 069
Podací místo: Chlumec nad Cidlinou, Klicperovo náměstí 68 (zvíře)
Jméno dle Zásilkovny: Petr Hrubeš
Číslo účtu: 0260167544/0300 (ČSOB Poštovní spořitelna)

      Ano, byl jsem si hned vědom, že to nepůsobí úplně důvěryhodně, ale rozhodl sem se do toho jít. Komunikace s prodejcem napřed probíhala v pohodě a rychle, vyfotil mi na požádání i štítek s přesným typem karty. Domluvili jsme se na Zásilkovně, takže bohužel nemám jeho adresu. UPDATE: prodejce si můžete předem proklepnout v této databázi bazarových podvodníků, kde lze hledat podle mailu, telefonu a čísla účtu. Každý den tam přibývají desítky reportů. Karta přišla dobře zabalená v bublinkách. Avšak po instalaci do PC a jeho zapnutí okamžitě vypadl zdroj jako při tvrdém zkratu. Rychlým měřením jsem zjistil, že zkrat je na napájecím 8-pinovém 12V konektoru. Když jsem vytáhl tento napájecí kabel, tak se PC zaplo a VGA zobrazila klasickou hlášku, že vyžaduje zapojení obou napájecích konektorů. Kartu jsem rozebral a našel jeden vypečený dvojitý MOSFET SM7320 (30 V, 64/85 A, 83 W, 5,2/1,8 mΩ, 1,5/4 nF, 25/47 ns) ve VRM pro GPU (Maxwell 2.0). Bylo tedy evidentní, že MOSFET odešel už dříve při nějaké nadměrné zátěži a nikoliv sám ve skříni či při dopravě nebo hned po zapnutí. Prodejci jsem napsal, ale ten se nadobro odmlčel. Pokud by v inzerátu napsal pouze stav neznámý nebo na náhradní díly, tak bych neřekl ani popel. UPDATE: Jak jsem si všiml, tato závada na těchto kartách od MSI není ojedinělá, neboť se objevují další inzeráty vadných karet zmiňujících zkrat na napájení - zřejmě to soudruzi v MSI podcenili a MOSFETy pracují na hranici možností. Všiml jsem si, že třeba karty EVGA používají ve VRM diskrétní pár MOSFETů pro každou fázi, což jistě zlepšuje odvod tepla (v součtu větší kontaktní plocha 2 pouzder než 1)...
      Napadlo mě šlehlý MOSFET jednoduše odpájet horkovzduchem, neb VRM má celkem 6-fází (synchronní buck) a tak by to měl v lehčí zátěži ve 2D bez problémů zvládnout na 5 fází. Karta pak skutečne naběhla a už jsem se radoval, že jen vyměním MOSFET (dá se koupit na AliExpressu) a bude to OK, jenže asi po 5 minutách provozu se z PC ozvalo zasyčení, čmoudík, smrádek a znovu vypadl zdroj. Bohužel pod tím spáleným MOSFETem se vypekl plošňák (po jeho odpájení to nevypadalo nijak zle) a jak zuhelnatěl, tak to způsobilo měkké zkraty mezi vrstvama (deska je 6-vrstvá), postupně se to víc a víc zahřívalo, teplota stoupala a odpor klesal, až to zahořelo. Snažil jsem se postižené místo vyškrábat ostrým lámacím nožem, ale stále je tam malý odpor cca 2 Ω a hoří to dál a dál, prostě PCB v prdeli, takže neopravitelné. Škoda jinak skoro funkční karty, která mohla jít snadno opravit. Během té chvilky co fungovala, jsem stihl otestovat VESA BIOS pod DOSem a má stejné quirky jako moje stávající GTX 670.

MSI GeForce GTX 970 GAMING 4G v1.1 top MSI GeForce GTX 970 GAMING 4G v1.1 PCB-top MSI GeForce GTX 970 GAMING 4G v1.1 GPU MSI GeForce GTX 970 GAMING 4G v1.1 blown MOSFET removed

      19.7.2022 Po shlédnutí tohoto ruského inspirativního videa o opravě lehce zuhelnatělé GTX 1080 jsem se rozhodl, že tomu ještě dám šanci. Také se mi podařilo najít schéma zapojení této karty. Frézoval jsem a frézoval, až se mi podařilo konečně zkrat zlikvidovat. Odpor proti zemi na postižené 12V větvi stoupnul na cca 15 kΩ (různě plaval podle nabíjení kondů). Zničil jsem tím ale zcela 2 fáze (3 a 6) s MOSFETy U4538, U4539 a také přestalo fungovat PWM řízení otáček větráků (na pinu 6 konektoru U516 není PWM, ale trvale log. 0). UPDATE: nepřestalo, ale video BIOS této karty zapíná větráky až při dosažení teploty GPU na 60°C. Po aktualizaci video BIOSu z verze 84.04.2F.00.F1 na verzi 84.04.84.00.23 se větráky točí i ve 2D na cca 900 RPM a teplota GPU se tak drží níže kolem 38°C (předtím s vypnutým větrákem to bylo kolem 58°C). Také jsem zjistil, že ze 4 výstupů mi fungují akorát 2: konektory DVI-I (VGA i DVI) a naštěstí i DisplayPort schopný vytlačit 4k rozlišení, naopak nefungují konektory DVI-D a HDMI (spoje k nim vedly někde ve vnitřních vrstvách PCB).
      Zdroj pro GPU core (NVVDD) má celkem 6 fází, které jsou napájeny z 3 různých zdrojů napětí 12 V a jsou tvořeny následovně:
fáze 1 a 4: gatedriver U17, MOSFETy U4536, U4537 a elyt EC152 - 12 V z PCI-E slotu;
fáze 2 a 5: gatedriver U16, MOSFETy U4540 - 12 V z 8-pin aux konektoru, U4541 - 12 V z 6-pin aux konektoru a elyt EC151;
fáze 3 a 6: gatedriver U15, MOSFETy U4538, U4539 - 12 V z 8-pin aux konektoru a elyt EC150.
Gatedrivery NCP81061 U15 a U16 jsou napájeny z 12V 8-pin aux konektoru a U17 je napájen z PCI-E slotu. VRM je řízen 3-fázovým PMIC NCP81174 U1 a každá fáze je následně rozdělena na 2 pomocí phase doublerů NCP81162 U12 (fáze 3 a 6), U13 (fáze 2 a 5), U14 (fáze 1 a 4), které se starají o balancování proudového odběru z obou fází. Výstupy všech fází jdou přes 6 tlumivek EL17 - EL22, kde jsou spojené do 1 uzlu filtrovaného 6 elyty C951, C953, C952, C954, C955, C963 (820 µF / 2,5 V). Ve 2D režimu je zde napětí NVVDD = 0,90 V. Karta s tímto vyfrézovaným kráterem běžela bez problémů asi 2 hodiny. Do 3D zátěže jsem se v tomto stavu neodvážil. Fáze 1 a 4 napájené z PCI-E fungují bezchybně, průběh na fázích 2 a 5 je nějaký zmršený. U fáze 5 mám podezření, že spíná pouze horní MOSFET a fáze 2 má zas nějak podezřele nízkou frekvenci. Přemýšlím o tom, že by se dal vyrobit nějaký plošňák s MOSFETy, který bych připevnil na zadní stranu karty a dotáhl tam drátkama řídicí signály z gatedriverů, ale bylo by nezbytné zajistit jim dobré chlazení...

MSI GeForce GTX 970 GAMING 4G v1.1 grinded off the carbonized PCB GPU VRM phase 1 GPU VRM phase 4 GPU VRM phase 2 GPU VRM phase 5
vybroušený PCB VRM fáze 1 VRM fáze 4 VRM fáze 2 VRM fáze 5

      22.7.2022 Podařilo se mi opravit poškozené fáze 2 a 5. Musel jsem prodrátovat 3 přerušené spoje mezi piny gatedriveru U16 (11 - SW2 fáze 5, 12 - DRVH2 fáze 5 a 13 - DRVL1 fáze 2) a MOSFETy U4540, U4541). Tenké drátky jsem zespoda nahoru protáhnul dříve vyfrézovanou dírou.

phase 5 & 2 repair wiring on PCB top phase 5 & 2 repair wiring on PCB bottom GPU VRM phase 1, 4, 5, 2 after fix GPU VRM phase 5 Ug low-side GPU VRM filtered output NVVDD
oprava VRM fáze 5, 2 oprava VRM fáze 5, 2 VRM fáze 1, 4, 5, 2 VRM fáze 5 Ug low-side VRM výstup NVVDD

      24.7.2022 Odhodlal jsem se nainstalovat ovladače (368.81 pro Windows XP, u GTX 970/980 je třeba navíc upravit soubor nv4_dispi.inf doplněním PCI ID) a kartu lehce potrápit. Avšak dosti záhy jsem narazil na podivné problémy se stabilitou ve 2D režimu. Stačilo otevřít prohlížečem obrázků nějakou fotku na full-screen 1:1 a trochu s ní zascrollovat. Obrazovka se tak do vteřiny vyplnila nějakou jednobarevnou či černou plochou a už se nešlo dostat zpět do dekstopu. Systém buď vytuhnul (nereagoval NumLock, ani tlačítko power) nebo bylo možné systém poslepu restartovat a během POSTu obraz opět naskočil. Nejde však o typické artefakty při problémech s VRAM. Podobně se karta chovala i u většiny demíček pro D3D/OpenGL. Ale kupodivu starý GLQuake, Quake III Arena, Doom 3 a Unreal Tournament šly hrát bez problémů. VRAM jsem zkusil otestovat pomocí VMT, který ale umožnil otestovat pouze 1 GB z 4 GB, žádnou chybu nenašel. Dále jsem zkoušel MemtestCL 1.00, kde při testování menší velikosti VRAM cca do 1,5 GB prošel bez chyby, zatím co při větší velikosti VRAM během vteřiny zčernala obrazovka a systém většinou vytuhnul, ale v logu žádná chyba nebyla. Odhaduju, že když GPU běží v klidu ve 2D poměrně hodně podtaktovaný s nízkou spotřebou, tak při skokové změně zátěže VRM s chybějícíma fázema nestihne vykrýt špičku, což způsobí pokles NVVDD a tím zátuh. Pokud třeba dojde ke zvýšení zátěže pomaleji, tak to ustojí. Holt to asi bez chybějících fází nepůjde...

      19.10.2022 Navrhnul jsem malý plošňáček pro náhradu 2 chybějících fází a nechal je příležitostně vyrobit s dalšíma deskama u JLCPCB. Mám 2 různé varianty: jednu s jedním výše zmíněným dvojitým MOSFETem SM7320, které jsem objednal na AliExpressu za 73 Kč (zatím nedorazily) a druhou se 2 diskrétními MOSFETy, kde jsem na pozici horního osadil slabší Infineon BSC059N03S (30 V, 73 A, 48 W, 4,6 mΩ, 2 nF, 15 nC, 22 ns) a na pozici dolního silnější Texas Instruments CSD16401Q5 (25 V, 100 A, 156 W, 1,3 mΩ, 3,2 nF, 21 nC, 30 ns). Destičku bude třeba nějak vhodně připevnit na kartu a propojit vstupy s gatedriverem U15 a výstupy s tlumivkami EL17, EL18.

      4.11.2022 Dnes mi konečně dorazily dvojité MOSFETy SM7320 z AliExpressu, ale po zapájení na destičku jsem zjistil, že mi Číňan poslal nějaké šméčko, protože oba měly šlus G-S na dolním FETu (u jednoho asi 160 Ω a u druhého asi 660 Ω). Na AliExpressu jsem tedy otevřel stížnost a následně mi byla plná částka refundována. O novou objednávku se už pokoušet nebudu a použiju osazenou destičku s diskrétními FETy.

new VRM power stage 2-phase module PCB top
VRM module

EVGA GTX 970 SC

      13.4.2023 Zatím jsem neměl čas opravit zbylé 2 fáze VRM na MSI GTX 970, ale mezitím jsem objevil na bazoši výhodnou nabídku EVGA GTX 970 SC, tentokrát osobka, prodejce působil férově a karta fungovala. Aktualizoval jsem video BIOS z verze 84.04.2F.00.70 na poslední verzi 84.04.84.00.70 z 25.6.2015 a při té příležitosti si upravil pomocí MaxwellBiosTweakeru nastavení větráků tak, aby se točily i ve 2D režimu (pomalu na 600 RPM), čímž se snížila teplota karty v klidu. Takto upravený video BIOS odmítne oficiální utilita NVFlash naflashovat (poslední verze pro Windows XP je 5.398.0), kvůli porušení digitálního podpisu a je potřeba použít upravený NVFlash 5.265 x86 či 5.287 x64 s vyhackovanou kontrolou certifikátů. Pod Windows XP se mi flashování stále nedařilo kvůli chybě "ERROR: Error attempting to map adapter (0x000001E7)" a nepomohlo ani někde doporučené zakázání karty v ovládacích panelech. Zafungovalo až flashnutí pod Windows 7 x64. Karta má SPI FlashROM Gigadevice GD25Q20. Zkusil jsem pak TrueRMS wattmetrem porovnat spotřebu celého PC proti stávající GTX 670, ale nejsou v tom žádné podstatné rozdíly, navíc ty staré hry moc GPU nevytížily a omezila to asi až propustnost pamětí při stejných FPS. Při přehrávání 4k H265 videa v MPC-HC mi kleslo vytížení CPU z 37% na 29% a vytížení GPU kleslo z 48% na 21%.

režim / spotřeba GTX 670 GTX 970
2D v DOSu 164 W 160 W
2D ve Windows XP (idle) 108 W 100 W
2D přehrávání FHD MP4 videa v MPC-HC 147 W 138 W
3D Unreal Tournament flyby (~ timedemo 1) 194 W / 595 FPS 211 W / 595 FPS
3D Doom 3 (CTRL + ALT + ~ timedemo demo1) 243 W / 370 FPS 238 W / 369 FPS
při rozlišení 1600 x 1200 / 32 bpp

      10.5.2023 Na webu nVidie jsem našel aktualizaci firmware pro DisplayPort z roku 2018, která by měla zlepšit kompatabilitu s novějšími DP 1.3 / 1.4 monitory. Aktualizace je určená pro GPU řady GTX 7xx - 10xx na OS Windows 7 - 10 (32-bit a 64-bit verze). Zkoušel jsem nainstalovat 64-bitovou verzi pod Windows 7. Program hlásil, že mou GTX 970 je třeba aktualizovat, ale po kliknutí na tlačítko update jen několikrát problikl monitor a po cca 10 s skončil chybou, že GPU firmware nemůže být aktualizován. Zkoušel jsem to s monitorem připojeným přes DP i DVI, zkusil jsem taky GTX 970 zakázat v Ovládacích panelech, aby systém běžel jen s generickým VESA ovladačem, ale žádná změna. Na webu jsem akorát našel, že někdo měl stejný problém na Windows 11 a pomohlo mu aktualizaci spustit v dočasně nainstalovaných Windows 10. 32-bitovou verzi jsem nezkoušel, neboť nemám aktuálně nainstalovaný podporovaný OS. Také jsem dohledal informace, jak je to s prioritou inicializace výstupů na grafických kartách EVGA. Někdy se to liší i podle toho, jestli se bootuje v legacy nebo UEFI režimu (s vypnutým CSM).
      UPDATE: Na Guru3D fóru jsem se dopídil, že výše zmíněná aktualizace GPU FW nefunguje na modifikovaných BIOSech a že pouze aktualizuje modul UEFI GOP, což je boot driver pro grafiku v UEFI režimu. VGA legacy BIOSu se to tedy netýká (na PC bez UEFI či s aktivním CSM). Aktualizaci GPU FW lze též provést alternativní utilitou GOPupd, která navíc obsahuje novější verze GOP modulů, které uživatelé vydumpovali ze svých grafických karet a funguje i na modifikovaných BIOSech (utilita vytvoří nový soubor a přímo ho neflashuje) Aktualizaci jsem úspěšně provedl pod Windows 7 x64 z GOP verze 0x2000C na verzi 0x20011 a utilita od nVidie pak hlásila, že FW je aktuální a není třeba ho aktualizovat.

NVIDIA Graphics Firmware Updater NVIDIA Graphics Firmware Updater Error GOPupd 1.9.6.5 Update Process NVIDIA Graphics Firmware Updater Already Updated



Zpět

Aktualizováno 21.6.2023 v 5:38