Jak jsem se napálil na bazoši aneb pokus o opravu VGA MSI GTX 970 GAMING 4G v1.1

      15.7.2022 Služby www.bazos.cz využívám spoustu let a dosud jsem neměl s prodejci ani kupci žádný problém, ale bohužel čas od času se objeví nějaký podvodník, který naruší důvěru a tak i já jsem se teď spálil při koupi VGA. Nejjednodušší podvod je, že za poslané peníze prostě nic nepošlou, tenhle zmrdeček sice poslal, ale vědomě nefunkční šrot. Bazoš důsledně neověřuje identitu uživatelů. Sice pro zadání inzerátu vyžaduje ověření telefonu přes SMS kód, ale do samotného inzerátu už lze napsat cokoliv. Bohužel jsem si nevšiml, že uživatel měl vyplněné neplatné číslo (musí se rozkliknout, aby se zobrazilo celé), neboť komunikuju převážně mailem (přes formulář odeslat odpověď). Zde je původní inzerát se všemi dostupnými údaji o prodejci, abyste se příp. kontaktu s ním mohli vyvarovat:

Inzerát 154895109: GTX 970
Naposledy funkční teď asi rok ve skříni. Nemám jak otestovat... Mám jen notebook.
Cena: 1299 Kč
Jméno: Pehe
Telefon: 123654789
Lokalita: 50002 Hradec Králové
E-mail: Physic5@seznam.cz
ID Zásilkovny: Z 118 8514 069
Podací místo: Chlumec nad Cidlinou, Klicperovo náměstí 68 (zvíře)
Jméno dle Zásilkovny: Petr Hrubeš
Číslo účtu: 0260167544/0300 (ČSOB Poštovní spořitelna)

      Ano, byl jsem si hned vědom, že to nepůsobí úplně důvěryhodně, ale rozhodl sem se do toho jít. Komunikace s prodejcem napřed probíhala v pohodě a rychle, vyfotil mi na požádání i štítek s přesným typem karty. Domluvili jsme se na Zásilkovně, takže bohužel nemám jeho adresu. UPDATE: prodejce si můžete předem proklepnout v této databázi bazarových podvodníků, kde lze hledat podle mailu, telefonu a čísla účtu. Každý den tam přibývají desítky reportů. Karta přišla dobře zabalená v bublinkách. Avšak po instalaci do PC a jeho zapnutí okamžitě vypadl zdroj jako při tvrdém zkratu. Rychlým měřením jsem zjistil, že zkrat je na napájecím 8-pinovém 12V konektoru. Když jsem vytáhl tento napájecí kabel, tak se PC zaplo a VGA zobrazila klasickou hlášku, že vyžaduje zapojení obou napájecích konektorů. Kartu jsem rozebral a našel jeden vypečený dvojitý MOSFET SM7320 (30 V, 64/85 A, 83 W, 5,2/1,8 mΩ, 1,5/4 nF, 25/47 ns) ve VRM pro GPU. Bylo tedy evidentní, že MOSFET odešel už dříve při nějaké nadměrné zátěži a nikoliv sám ve skříni či při dopravě nebo hned po zapnutí. Prodejci jsem napsal, ale ten se nadobro odmlčel. Pokud by v inzerátu napsal pouze stav neznámý nebo na náhradní díly, tak bych neřekl ani popel. UPDATE: Jak jsem si všiml, tato závada na těchto kartách od MSI není ojedinělá, neboť se objevují další inzeráty vadných karet zmiňujících zkrat na napájení - zřejmě to soudruzi v MSI podcenili a MOSFETy pracují na hranici možností. Všiml jsem si, že třeba karty EVGA používají ve VRM diskrétní pár MOSFETů pro každou fázi, což jistě zlepšuje odvod tepla (v součtu větší kontaktní plocha 2 pouzder než 1)...
      Napadlo mě šlehlý MOSFET jednoduše odpájet horkovzduchem, neb VRM má celkem 6-fází (synchronní buck) a tak by to měl v lehčí zátěži ve 2D bez problémů zvládnout na 5 fází. Karta pak skutečne naběhla a už jsem se radoval, že jen vyměním MOSFET (dá se koupit na AliExpressu) a bude to OK, jenže asi po 5 minutách provozu se z PC ozvalo zasyčení, čmoudík, smrádek a znovu vypadl zdroj. Bohužel pod tím spáleným MOSFETem se vypekl plošňák (po jeho odpájení to nevypadalo nijak zle) a jak zuhelnatěl, tak to způsobilo měkké zkraty mezi vrstvama (deska je 6-vrstvá), postupně se to víc a víc zahřívalo, teplota stoupala a odpor klesal, až to zahořelo. Snažil jsem se postižené místo vyškrábat ostrým lámacím nožem, ale stále je tam malý odpor cca 2 Ω a hoří to dál a dál, prostě PCB v prdeli, takže neopravitelné. Škoda jinak skoro funkční karty, která mohla jít snadno opravit. Během té chvilky co fungovala, jsem stihl otestovat VESA BIOS pod DOSem a má stejné quirky jako moje stávající GTX 670.

MSI GeForce GTX 970 GAMING 4G v1.1 top MSI GeForce GTX 970 GAMING 4G v1.1 PCB-top MSI GeForce GTX 970 GAMING 4G v1.1 GPU MSI GeForce GTX 970 GAMING 4G v1.1 blown MOSFET removed

      19.7.2022 Po shlédnutí tohoto ruského inspirativního videa o opravě lehce zuhelnatělé GTX 1080 jsem se rozhodl, že tomu ještě dám šanci. Také se mi podařilo najít schéma zapojení této karty. Frézoval jsem a frézoval, až se mi podařilo konečně zkrat zlikvidovat. Odpor proti zemi na postižené 12V větvi stoupnul na cca 15 kΩ (různě plaval podle nabíjení kondů). Zničil jsem tím ale zcela 2 fáze (3 a 6) s MOSFETy U4538, U4539 a také přestalo fungovat PWM řízení otáček větráků (na pinu 6 konektoru U516 není PWM, ale trvale log. 0). UPDATE: nepřestalo, ale video BIOS této karty zapíná větráky až při dosažení teploty GPU na 60°C. Po aktualizaci video BIOSu z verze 84.04.2F.00.F1 na verzi 84.04.84.00.23 se větráky točí i ve 2D na cca 900 RPM a teplota GPU se tak drží níže kolem 38°C (předtím s vypnutým větrákem to bylo kolem 58°C). Také jsem zjistil, že ze 4 výstupů mi fungují akorát 2: konektory DVI-I (VGA i DVI) a naštěstí i DisplayPort schopný vytlačit 4k rozlišení, naopak nefungují konektory DVI-D a HDMI (spoje k nim vedly někde ve vnitřních vrstvách PCB).
      Zdroj pro GPU core (NVVDD) má celkem 6 fází, které jsou napájeny z 3 různých zdrojů napětí 12 V a jsou tvořeny následovně:
fáze 1 a 4: gatedriver U17, MOSFETy U4536, U4537 a elyt EC152 - 12 V z PCI-E slotu;
fáze 2 a 5: gatedriver U16, MOSFETy U4540 - 12 V z 8-pin aux konektoru, U4541 - 12 V z 6-pin aux konektoru a elyt EC151;
fáze 3 a 6: gatedriver U15, MOSFETy U4538, U4539 - 12 V z 8-pin aux konektoru a elyt EC150.
Gatedrivery NCP81061 U15 a U16 jsou napájeny z 12V 8-pin aux konektoru a U17 je napájen z PCI-E slotu. VRM je řízen 3-fázovým PMIC NCP81174 U1 a každá fáze je následně rozdělena na 2 pomocí phase doublerů NCP81162 U12 (fáze 3 a 6), U13 (fáze 2 a 5), U14 (fáze 1 a 4), které se starají o balancování proudového odběru z obou fází. Výstupy všech fází jdou přes 6 tlumivek EL17 - EL22, kde jsou spojené do 1 uzlu filtrovaného 6 elyty C951, C953, C952, C954, C955, C963 (820 µF / 2,5 V). Ve 2D režimu je zde napětí NVVDD = 0,90 V. Karta s tímto vyfrézovaným kráterem běžela bez problémů asi 2 hodiny. Do 3D zátěže jsem se v tomto stavu neodvážil. Fáze 1 a 4 napájené z PCI-E fungují bezchybně, průběh na fázích 2 a 5 je nějaký zmršený. U fáze 5 mám podezření, že spíná pouze horní MOSFET a fáze 2 má zas nějak podezřele nízkou frekvenci. Přemýšlím o tom, že by se dal vyrobit nějaký plošňák s MOSFETy, který bych připevnil na zadní stranu karty a dotáhl tam drátkama řídicí signály z gatedriverů, ale bylo by nezbytné zajistit jim dobré chlazení...

MSI GeForce GTX 970 GAMING 4G v1.1 grinded off the carbonized PCB GPU VRM phase 1 GPU VRM phase 4 GPU VRM phase 2 GPU VRM phase 5
vybroušený PCB VRM fáze 1 VRM fáze 4 VRM fáze 2 VRM fáze 5

      22.7.2022 Podařilo se mi opravit poškozené fáze 2 a 5. Musel jsem prodrátovat 3 přerušené spoje mezi piny gatedriveru U16 (11 - SW2 fáze 5, 12 - DRVH2 fáze 5 a 13 - DRVL1 fáze 2) a MOSFETy U4540, U4541). Tenké drátky jsem zespoda nahoru protáhnul dříve vyfrézovanou dírou.

phase 5 & 2 repair wiring on PCB top phase 5 & 2 repair wiring on PCB bottom GPU VRM phase 1, 4, 5, 2 after fix GPU VRM phase 5 Ug low-side GPU VRM filtered output NVVDD
oprava VRM fáze 5, 2 oprava VRM fáze 5, 2 VRM fáze 1, 4, 5, 2 VRM fáze 5 Ug low-side VRM výstup NVVDD

      24.7.2022 Odhodlal jsem se nainstalovat ovladače (368.81 pro Windows XP, u GTX 970/980 je třeba navíc upravit soubor nv4_dispi.inf doplněním PCI ID) a kartu lehce potrápit. Avšak dosti záhy jsem narazil na podivné problémy se stabilitou ve 2D režimu. Stačilo otevřít prohlížečem obrázků nějakou fotku na full-screen 1:1 a trochu s ní zascrollovat. Obrazovka se tak do vteřiny vyplnila nějakou jednobarevnou či černou plochou a už se nešlo dostat zpět do dekstopu. Systém buď vytuhnul (nereagoval NumLock, ani tlačítko power) nebo bylo možné systém poslepu restartovat a během POSTu obraz opět naskočil. Nejde však o typické artefakty při problémech s VRAM. Podobně se karta chovala i u většiny demíček pro D3D/OpenGL. Ale kupodivu starý GLQuake, Quake III Arena, Doom 3 a Unreal Tournament šly hrát bez problémů. VRAM jsem zkusil otestovat pomocí VMT, který ale umožnil otestovat pouze 1 GB z 4 GB, žádnou chybu nenašel. Dále jsem zkoušel MemtestCL 1.00, kde při testování menší velikosti VRAM cca do 1,5 GB prošel bez chyby, zatím co při větší velikosti VRAM během vteřiny zčernala obrazovka a systém většinou vytuhnul, ale v logu žádná chyba nebyla. Odhaduju, že když GPU běží v klidu ve 2D poměrně hodně podtaktovaný s nízkou spotřebou, tak při skokové změně zátěže VRM s chybějícíma fázema nestihne vykrýt špičku, což způsobí pokles NVVDD a tím zátuh. Pokud třeba dojde ke zvýšení zátěže pomaleji, tak to ustojí. Holt to asi bez chybějících fází nepůjde...

      19.10.2022 Navrhnul jsem malý plošňáček pro náhradu 2 chybějících fází a nechal je příležitostně vyrobit s dalšíma deskama u JLCPCB. Mám 2 různé varianty: jednu s jedním výše zmíněným dvojitým MOSFETem SM7320, které jsem objednal na AliExpressu za 73 Kč (zatím nedorazily) a druhou se 2 diskrétními MOSFETy, kde jsem na pozici horního osadil slabší Infineon BSC059N03S (30 V, 73 A, 48 W, 4,6 mΩ, 2 nF, 15 nC, 22 ns) a na pozici dolního silnější Texas Instruments CSD16401Q5 (25 V, 100 A, 156 W, 1,3 mΩ, 3,2 nF, 21 nC, 30 ns). Destičku bude třeba nějak vhodně připevnit na kartu a propojit vstupy s gatedriverem U15 a výstupy s tlumivkami EL17, EL18.

      4.11.2022 Dnes mi konečně dorazily dvojité MOSFETy SM7320 z AliExpressu, ale po zapájení na destičku jsem zjistil, že mi Číňan poslal nějaké šméčko, protože oba měly šlus G-S na dolním FETu (u jednoho asi 160 Ω a u druhého asi 660 Ω). Na AliExpressu jsem tedy otevřel stížnost a následně mi byla plná částka refundována. O novou objednávku se už pokoušet nebudu a použiju osazenou destičku s diskrétními FETy.

new VRM power stage 2-phase module PCB top
VRM module



Zpět

Aktualizováno 8.11.2022 v 3:23