Zamyšlení nad procesory intel

      13.2.2002 Dříve jsem na procesory intelu nenechal dopustit. A to z několika dobrých důvodů. Člověk (za sice poněkud vyšší cenu) dostal kvalitní procesor s rychlým koprocesorem, který šel výborně přetaktovat a přitom produkoval méně tepla než konkurence. Navíc pro intely byl dostatek kvalitních motherboardů (např. s legendárním chipsetem 440BX) s bezproblémovým chodem AGP a dostatkem slotů ISA.
      Časy se však mění a intel nám trochu usnul na vavřínech, díky čemuž největší konkurent AMD dosáhl doposud největšího významu. Nedávno mě překvapil článek o low-end procesoru VIA C3. Jeho výkon je bohužel degradován hrozně pomalým FPU avšak datová propustnost by díky 133MHz FSB nemusela být vůbec špatná. K dobru mu můžeme také připočíst instrukční sadu 3DNow! a kompatabilitu se Socket 370. Zato se však může chlubit 0,13µm technologií, díky čemuž si vystačí s pasivním chladičem (ztrátový výkon 733MHz CPU je 6 - 10 W). Navíc má procesor dokonce softwarově nastavitelný takt a tak lze ještě spotřebu snížit. To bych od VIA nečekal.
      A zatím intel lpí na své už zastaralé 0,18µm technologii a problémy s nadměrným teplem (u Pentia 4 až 50 W) řeší zavedením nového standardu ATX 2.0 a tak si patrně budeme muset koupit nové kastle.
      Právě uváděním stále nových a přitom nekompatabilních standardů mě intel velice popouzí. Stačí se podívat na vývoj patic procesorů. Socket 7 sloužil už dost dlouho klasickým pentiím (AMD ho ještě drželo pár let při životě procesory K6-II a K6-III) a tak pro novou generaci procesorů byla potřeba nová patice.
      Intel tedy vyvinul dosti odlišný Slot 1 pro Pentium II, které mělo externí L2 cache mimo čip CPU. Za chvíli zjistil, že výroba těchto procesorů je moc drahá a vrátil se ke klasické patici v podobě Socket 370. Zpočátku vyráběl procesory PPGA a poté sice se stejnou paticí avšak nekompatabilní procesory FC-PGA. Tím si přišli na své i výrobci redukcí. Redukce pro Slot 1 jsou celkem rozšířené, hroší je to však s redukcí PPGA:FC-PGA. Navíc nově plánované Pentium III s jádrem Tualatin (0,13 µm) bude vyžadovat opět nový Socket FC-PGA II a napěťový regulátor VRM s krokem 25 mV. Ani ti, co vsadili rovnou na Pentium 4 nebudou mít pokoje, protože součastné P4-Willamette pro Socket 423 bude nahrazeno novým P4-Northwood pro Socket 478 vyžadujícím i nový chipset. Myslím, že spíše než krátkozrakost intelu, je to jeho způsob, jak z lidí neustále tahat peníze...
      Konkurence AMD je v tomto ohledu mnohem věrnější svým standardům a vystačí si se starším Slotem A a součastným Socketem A. Procesory AMD jsou na stejných frekvencích už dokonce rychlejší než intely, včetně FPU (a to při znatelně nižší ceně). Přetaktovatelnost není sice tak dobrá, ale díky možnosti jednoduše odemknout násobič (což se na intelech ještě nikomu nepovedlo) lze přetaktování lépe rozvrhnout mezi FSB a jádro. AMD také používá mnohem propustnější FSB 100 / 133 MHz DDR (200 / 266 MHz efektivně) ve spojení s levnějšími pamětmi DDR SDRAM oproti drahým Rambus RDRAM na které se zaměřuje intel. Tepelná ztráta procesorů AMD je o něco větší než u intelů. Nepočetná nabídka základních desek pro Socket A se přece jen rozšiřuje a najdou se i nějaké se slotem ISA (např. Abit KT7E). Využívají chipsety VIA, AMD a připravuje se nForce od nVidie. Jen by mě zajímalo, jak a nakolik bezproblémově implementují AGP (s AGP na chipsetu VIA pro intel CPU jsem si užil problémů dost).
      Prodej low-endových konkurenčních procesorů AMD stále roste a pokud nás běžné uživatele bude intel dále ignorovat, zbude mu za pár let jen část trhu s Xeony pro servery, což si zas myslím, že by byla škoda. A tak vážně uvažuji, že i přes svou důvěru v intel, při koupi příští základní desky a procesoru už možná budu intel outside...

      25.10.2006 Při rozmýšlení nad nadcházejícím upgradem svého PC jsem se po pár letech vrátil zpět k této úvaze. Vývoj situace v oblasti procesorů mě nijak příliš nepřekvapoval. Intel zatloukl poslední hřebík do rakve Socketu 370 procesorem Celeron/Pentium III Tualatin, což byl na delší dobu poslední kvalitní CPU, který intel vyrobil. Očekávaný nárůst výkonu u Pentia 4 nebyl tak velký, jak se čekalo. Celeron Tualatin přetaktovaný na stejnou frekvenci jako P4 byl v řadě programů rychlejší než jeho nástupce. Asi taky proto se intel snažil tento debakl zamaskovat rychlým ukončením Tualatinu a masivní mediální kampaní propagující P4.
      Intel naháněl výkon zejména zvyšováním frekvence (až někam do 3,8 GHz), což ale šlo ruku v ruce s růstem spotřeby a problematickou uchladitelností jádra. Tehdá jsem si stěžoval, že 50 W je hodně a přitom Pentiu 4 D se podařilo překonat hranici TDP 100 W. Konkurent AMD mezitím neustále nabíral na síle a dokazoval, že umí podat stejný výkon při znatelně nižší frekvenci díky lepší architektuře. Ale čísla GHz se prodávají líp, i když i řada běžných uživatelů už tenhle trik prokoukla. Intel také za tu dobu stihl 2x změnit Socket z původního 423 přes 478 po LGA 775. Já jsem se rozhodl celou generaci P4 (NetBurst) ignorovat a provedl jsem pouze menší upgrade z Celeronu Coppermine na Celeron Tualatin 1100@1466 MHz, který mi necelé 2 roky dobře sloužil v MB Abit BX133-Raid.
      Když už jsem nad intelem pomalu lámal hůl, objevil se nový procesor Pentium M určený zejména pro notebooky (Socket 479), spolu s novým chipsetem známý jako platforma Centrino. Tento CPU od návrhářů izraelské divize intelu dosahuje na stejné frekvenci oproti P4 znatelně většího výkonu a to při menší spotřebě energie. Nejedná se přitom o kdovíjakou novinku, vzniklo totiž vylepšením jádra starého dobrého Pentia III, kterému se přidala veliká L2 cache, propustnější QDR sběrnice a výroba probíhala 130, 90 a 65nm technologií. Bohužel na desktopy se Pentium M moc nerozšířilo (intel dobře věděl, že si to vzhledem k P4 nemůže dovolit), neb základních desek je dosti po málu (asi s jediným chipsetem i855). Také se objevila redukce do Socketu 478. U nás však ne moc dostupná a předražená (jak jinak), která ale vyžadovala podporu BIOSu, jež mnoho desek nemělo.
      Doufal jsem, že intel časem pochopí, že s P4 šlápl vedle a bude dále rozvíjet Pentium-M. A tak jsem se také dočkal (zřejmě díky tomu, že intel narazil na frekvenční strop současné křemíkové technologie :). Izraelci se činili a přišli s novými procesory Core Duo a Core Solo pro notebooky (kódové jméno Yonah, Socket 479) a konečně Core 2 Duo (Conroe / Allendale, Socket LGA 775) pro desktopy a notebooky (Merom, Socket 479). Dochází také k rozmachu multiprocesingu. 2 jádra už nabízelo Pentium 4 D, ale v případě Core 2 Duo ani není dostupná jednojádrová verze a co nevidět tu bude čtyřjádrová. Otázka je, kolik současných programů to plně využije. Předpokládám však, že masivní rozšíření více jader donutí programátory nad tím zapřemýšlet.
      V současnosti jsou pro desktopy dostupné procesory Core 2 Duo E6300, E6400, E6600 a E6700 pracující na frekvencích 1,86, 2,13, 2,40 a 2,67 GHz. Na první pohled jsou to čísla menší, výkonově si ale E6700 poradí s Pentiem 4 D na 3,6 GHz i Athlonem 64 FX-60 na 2,6 GHz. Max. ztrátový výkon se pohybuje kolem přijatelných 65 W díky 65nm technologii (to dává také velký potenciál přetaktování). EIST (Enhanced Intel SpeedStep) umožňuje dynamicky za chodu měnit frekvenci (snížením násobiče) a napětí jádra. Core 2 Duo je vybaveno 2x 32 kB L1 cache a 2 nebo 4 MB sdílené L2 cache. Díky tomu si jádra mohou rychleji vyměňovat data, aniž by se tím zatěžovala pomalá FSB. V případě, že se využívá jen jedno jádro, je mu celá L2 cache k dispozici a tak ani část nezahálí. Instrukční sada byla rozšířena o SSE4 a 64-bitové rozšíření EM64T (Extended Memory 64 Technology) převzaté od AMD. Sběrnice FSB běží na 266 MHz QDR (1066 MHz efektivně), což spolu s velkou a rychlou cache zvětšuje propustnost paměťového subsystému. Nové intelí chipsety navíc mají 2-kanálový řadič paměti, který při použití 2 stejných SDRAM modulů přidá dalších pár desítek %.
      Zmínil jsem, že procesor Core 2 Duo je určen pro Socket LGA 775 (stejně jako nová Pentia 4), ale nebyl by to intel, kdyby s uživateli stávajících desek řádně nevyjebal. Ano historie se opakuje. Intel trochu pozměnil pár pinů a specifikaci napájení, díky čemuž se C2D v těchto deskách vůbec nerozjede a uživatel má prostě smolíka. Není to ani problém chipsetu, jak se můžeme někde mylně dočíst, jen je potřeba implementovat novou specifikaci napěťového regulátoru VRM. Možná že by to ale šlo i jinak? Výrobci postupně vydávají nové revize svých desek s podporou C2D i zcela nové desky, nejčastěji s PCI-E chipsety i945, i975 a i965 (kde se vyskytly nějaké chybky a čeká se na další stepping).
      Celkově se tedy procesor Core 2 Duo velmi vydařil a to mě inspirovalo k dlouho odkládanému kompletnímu upgradu. Léta jsem váhal, ale nijak toho nelituju, že jsem P4 úplně vynechal. Přechod k AMD se tedy nekoná :). Nakonec jsem se podle ceny rozhodl pro C2D E6400 na 2,13 GHz s 2 MB L2 cache, což je můj už šestý procesor od intelu, pro nějž jsem vybral základní desku Asus P5LD2 s chipsetem intel 945P + ICH7R. Po roce a půl jsem základní desku vyměnil za Gigabyte GA-P31-DS3L s chipsetem intel P31, který podporuje novější 45nm C2D procesory, z nichž jsem si vybral rychlé dvoujádro E8500 na 3,16 GHz s 6 MB L2 cache, později nahrazené nejvyšším modelem E8600 na 3,33 GHz.

      7.10.2015 Intel z úspěchu procesorů Core 2 Duo a Core 2 Quad těžil po mnoho let a velmi se mu dařilo. Koncem roku 2008 pak vydal další generaci procesorů Core i5 a i7 založených na nové revoluční architektuře Nehalem. Její hlavní novinky jsou integrace 2 - 3 kanálového paměťového řadiče DDR3 SDRAM (AMD už integrovalo paměťový řadič do svého Opteronu o mnoho let dříve a po vyladění počátečních potíží se to ukázala být ta správná cesta) a změna architektury cache na tříúrovňovou, což zhruba zdvojnásobilo paměťovou propustnost proti C2D. Tím se výrazně zjednodušil design základních desek, kde zmizel severní můstek MCH (Memory Controller Hub) a jižní můstek ICH (I/O Controller Hub) se změnil na PCH (Platform_Controller_Hub) s kterým procesor komunikuje přes QPI (QuickPath Interconnect). Novější rodina procesorů Lynnfield do sebe navíc integruje 16-linkový PCI-E 2.0 řadič. Na komunikaci s PCH tak stačí pomalejší sběrnice DMI (Direct Media Interface). Typická konfigurace Core i7 pro desktopy má 4 jádra (navíc se zpět do hry vrací Hyper-threading) s 8 MB sdílené L3 chache, kde každé jádro má dále k dispozici dedikovanou 64 kB L1 cache a 256 kB L2 cache. Přibyly též nové instrukce SSE4.2 a HW podpora virtualizace VT-x. Samozřejmě nechybí (tentokrát celkem oprávněně) nový socket a to hned ve 3 variantách: LGA 1156 pro desktopy, LGA 1366 pro výkonné pracovní stanice a servery a LGA 1567 pro high-end servery. Výrobní proces zůstává na 45 nm, což poněkud limituje frekvenční růst na max. 3,33 GHz.
      Je též zajímavé, jak intel změnil svůj postoj k přetaktování. Od nekompromisního uzamčení násobiče směrem nahoru přešel k technologii Turbo Boost, která je defakto mírným přetaktováním v mezích zákona (rozuměj limitu TDP). V případě potřeby (skrze požadavek OS) se tak dynamicky zvedne násobič a Vcore. Dosažená turbo frekvence závisí na počtu aktivních jader (maximální turbo frekvence dosáhne jen jedno jádro) a na odebíraném proudu, příkonu a teplotě. Jelikož z této architektury zmizela FSB, je zde frekvence jádra odvozena od base clock 133 MHz. Z ní se odvozuje též frekvence PCI-E a dalších kritických periferií, takže s ní nejde moc hýbat. Pokud to základní deska umožňuje, lze base clock zvýšit jen o pár MHz.
      Později v roce 2010 došlo ke zmenšení výrobní technologie na 32 nm pod označením Westmere. Max. frekvence se tak posunula na 3,86 GHz (u některých vzorků Xeonů až 4,4 GHz). Do rodiny Core i5 a i7 přibyl ještě očesaný 2-jádrový procesor i3. Instrukční sada byla rozšířena o podporu AES Zásadní novinkou byla integrace grafického jádra do některých procesorů (mobilní rodiny Arrandale a desktopové rodiny Clarkdale), které využívá sdílené operační paměti i výhody L3 cache. Jedná se o multičipové procesory, kde CPU bylo vyráběno novější 32nm technologií zatímco GPU starší 45nm technologií.
      Začátkem roku 2011 vydal intel novou architekturu Core 2. generace s názvem Sandy Bridge. Nejedná se už o žádnou velkou revoluci, ale spíše drobnější vylepšení předchozí architektury. Kromě optimalizací výpočetních jader přibyla nová 256-bitová instrukční sada AVX (Advanced Vector Extensions) a bezpečnostní technologie TXT (Trusted Execution Technology) spolupracující s TPM (Trusted Platform Module). Nejvíce změn prodělalo grafické jádro HD Graphics s podporou kodeku H.264, které se stalo u některých procesorů nedílnou součástí čipu. Výrobní technologie zůstává na 32 nm a nejvyšší modely dosahují turbo frekvence 4,0 GHz. 4-jádrová varianta s 8 MB L3 cache obsahuje více než 1 miliardu tranzistorů. Nechybí též "oblíbená" změna socketu na LGA 1155 pro desktopy a LGA 2011 pro výkonné pracovní stanice a servery. Alespoň že intel myslel i na nadšence overclockery a vydal řadu procesorů 2xxxK s odemčeným násobičem (tzn. lze nastavit vyšší než jmenovitou turbo frekvenci a to pro každé jádro zvlášť bez ohledu na TDP), avšak za patřičně vyšší cenu. Při upgrade PC koncem roku 2015 jsem si jeden takový model Core i7-2600K pořídil z druhé ruky a myslím, že i dnes výkonově nijak moc nezaostává. S trochou přetaktování bez problému dožene i současné top modely Core i7.
      Po roce intel zmenšil výrobní technologii na 22 nm, která poprvé využívá 3D tri-gate tranzistory. 3. generace Core nese název Ivy Bridge a přináší pár dalších vylepšení jako třeba nový řadič PCI-E 3.0 a instrukci RdRand. Nejvyšší modely dosahují jen nepatrně vyšší turbo frekvence 4,1 GHz proti Sandy Bridge a taktéž nárůst výkonu CPU jen o pár %. Naopak u GPU je zrychlení znát. Zvýšil se počet EU, podpora DX11, OpenGL 4.0, OpenCL 1.1 a 4k videa, ale pořád je to někde jinde, než externí PCI-E VGA. Ale pro méně náročnější uživatele, zejména u notebooků to vystačí a ušetří baterie. Výkonnější notebooky integrují samostatný GPU čip od ATI/nVidie, na který lze dynamicky přepnout v případě spuštění nějaké náročnější 3D aplikace. Patice tentokrát zůstala stejná, takže s patřičnou podporou BIOSu mohou upgradovat i majitelé starších desek pro Sandy Bridge. Overclockeři ale z nových CPU nebyly moc nadšeni, protože při přetaktování velmi rychle rostla teplota jádra, bez ohledu na teplotu chladiče. Zjistilo se, že zde intel místo pájení IHS ke křemíkovému čipu použil nepříliš kvalitní teplovodivou pastu. Obnovila se tak stará známá praktika sundávání IHS z dob Pentia III Tualatin a s dobře nakontaktovaným chladičem s měděnou základnou bylo možno výrazně snížit teplotu jádra CPU. I po této úpravě nešlo přetaktování tak dobře, zřejmě kvůli větší hustotě integrace, větším leakage proudům a nutnosti více zvyšovat Vcore. Později jsem si přečetl zajímavý článek o pájení CPU jader, které není vůbec technologicky jednoduchý proces a zejména u menších jader přináší vážné komplikace s životností.
      Intel najel na pravidelný proces aktualizací svých CPU zvaný tik-tak. Tik znamená změnu technologie výroby (jemnější litografie), do které překlopí předchozí generaci s menšími vylepšeními. Tak zas znamená výraznější změnu samotné architektury vyrobené na odladěné technologii. V létě 2013 vydal novou architekturu Core 4. generace s názvem Haswell. Intel se tentokrát popral s velkou výzvou - podařilo se mu do procesoru integrovat napěťový regulátor FIVR (Fully Integrated Voltage Regulator), celá prezentace zde. Ten se sice neobejde bez dalšího předregulátoru na základní desce (pouštět do CPU rovnou 5 či 12 V by bylo na dané technologii nereálné), ale umožní tak procesoru lépe zvládat dynamické proudové špičky při změně zátěže, rychlejší přechody mezi úspornými a výkonovými stavy a jemnější změnu Vcore. FIVR se skládá celkem z 320 fází (včetně integrovaných planárních cívek), každá skupina po 16 fázích dodá proud až 25 A s spínací frekvence se pohybuje v rozsahu 30 - 140 MHz. To je řádově jinde, než běžný 4-fázový VRM s efektivní frekvencí 1 MHz. To se samozřejmě neobešlo bez změny patice na LGA 1150 pro desktopy a LGA 2011-v3 pro servery, je sice fyzicky stejná jako LGA 2011-v1, ale elektricky kompatabilní není. Dále přibyly nové instrukční sady AVX2, FMA3, TSX (avšak kvůli HW chybě nepoužitelné) a max. turbo frekvence byla zvýšena na 4,4 GHz. Nejvíce vylepšení bylo opět v GPU. Pro některé mobilní verze procesorů byla použita nová grafika Iris Pro 5200 se 128 MB eDRAM integrované přímo v BGA pouzdru (avšak jako samostatný kus křemíku vedle CPU). U novější řady procesorů Haswell Refresh z roku 2014 byla použita kvalitnější tepelná pasta mezi čipem a IHS.
      Dalším tikem byl přechod na 14nm litografii koncem roku 2014, kdy byla vydána 5. generace Core s názvem Broadwell. Změny architektury jsou spíše jen kosmetické. Vyjma prvních Broadwellů byla opravena chyba v implementaci TSX, přibyla nová instrukce RdSeed pro generování náhodných čísel z interního šumového generátoru a byla implementována nová bezpečnostní funkce SMAP, která by měla zabránit nechtěnému spuštění kódu z paměti uživatelského procesu v kernel módu (exploity k eskalaci oprávnění). To samozřejmě vyžaduje zapracovat podporu SMAP i do OS. Procesory s jádrem Broadwell byly cíleny zejména do mobilní sféry (pouzdra BGA) a do serverů (socket LGA 2011-v3). Pro desktopy (socket LGA 1150) byly určeny pouze 2 modely Core i5 a i7 s integrovanou grafikou Iris Pro 6200, která má k dispozici 128 MB eDRAM (stále 2 čipy v 1 pouzdře jako u Haswellu). Max. turbo frekvence dosahuje pouze 3,7 GHz u desktopových CPU a 4,0 GHz u serverových CPU, možnosti přetaktování jsou mizerné.
      Po odladění 14nm výrobního procesu uvedl intel koncem léta 2015 novou architekturu Core 6. generace s názvem Skylake, která přináší některé zásadní změny. Intel se rozhodl z blíže neurčeného důvodu odstranit z jádra procesoru svůj unikátní design integrovaného regulátoru FIVR, který u Haswellu tolik opěvoval. Možná to zhoršovalo výtěžnost výroby nebo se předpokládané výhody v reálu ukázaly býti menší a nevýhody větší, než se původně čekalo. To s sebou, jak je u intelu zvykem, neslo další změnu patice na LGA 1151 pro desktopy a pro servery se chystá během roku 2017 nový socket LGA 2066. Kapánek problémovou změnou se ukázalo ztenčení substrátové PCB procesoru, což vedlo v některých případech k nepříjemným deformacím vlivem přítlaku chladiče. Další zásadní změnu prodělal integrovaný paměťový řadič, který nyní podporuje paměti DDR4 a DDR3L, které pracují s nižším napájecím napětím (1,2 V resp. 1,35 V) o proti stávajícím DDR3 (1,5 V). Přestože intel DDR3 oficiálně nepodporuje (kvůli potenciální možnosti poškození CPU vyšším napětím na paměťové sběrnici), někteří výrobci MB přesto takové základní desky vyrobili. V současnosti už cena DDR4 pamětí klesla, takže nemá cenu to riskovat. Dále přibyla nové instrukční sada AVX-512 a bezpečnostní rozšíření MPX a SGX pro kontrolu mezí a lepší ochranu paměti uživatelských procesů. Konstantně se vylepšuje GPU - HD/Iris Graphics 5xx s podporou DX12, OpenGL 4.5, OpenCL 2.0, kodeků VP8, VP9 a H.265 a 128 MB eDRAM u některých modelů. Max. turbo frekvence se mírně zvýšila na 4,2 GHz (spolu s TDP), což stále nedosahuje taktů Haswellu ale i tak dosahuje průměrného nárůstu single-thread výkonu asi o 6%.
      Intel se opozdil s vývojem 10nm výrobního procesu a tak trochu naboural stávající zaběhnuté tik-tak schéma vydáním 7. generace Core s názvem Kaby Lake na odladěném 14nm procesu koncem léta 2016. Přináší pouze drobné změny a vylepšení, převážně v GPU části (podpora HDCP 2.2, HW kódování H.264 a H.265 v 10-bitové hloubce, které několikanásobně snižuje spotřebu procesoru při přehrávání videa oproti SW implementaci). Instrukční sada a patice LGA 1151 zůstala beze změn, pouze se zvýšila max. turbo frekvence na 4,5 GHz a rychlost přechodu z jedné frekvence na druhou. To mi přijde trochu málo. Předpokládá se, že i další generace Coffee Lake bude vyráběná též 14nm procesem a půjde o další recyklaci Skylake. Cannon Lake na 10 nm procesu bude nejspíš až v roce 2018.
      Intel u každé nové generace slibuje výrazný nárůst IPC, ale skutečnost v reálných aplikacích je jiná, single-thread výkon roste od dob Sandy Bridge jen velmi málo (při stejné frekvenci) a samotná max. frekvence se od dob Haswellu také zvýšila jen nepatrně. Na dlouhodobější srovnání výkonu různých generací Core se můžete podívat zde, zde a zde. Ceny intelích procesorů se přitom dlouhodobě drží na výši jako nikdy předtím, což je důsledek toho, že intelu chybí pořádná konkurence. Kvalita ceně bohužel občas moc neodpovídá, jak se ukázalo třeba v aféře umírajících serverových Atomů C2xxx těsně po záruce. Vývoj AMD jsem moc nesledoval, protože od dob Core 2 bylo neustále pozadu a nezměnily to ani všechny pokusy o vícejádrové procesory Bulldozer, Piledriver, Steamroller a Excavator dohnané do extrémních šíleností typu 8-jádrový 32nm přímotop AMD FX-9590 na 4,7 / 5,0 GHz s TDP 220 W. Nutno podotknout, že intel házel AMD dost nepěkně klacky pod nohy svými neférovými obchodními praktikami, za což byl posléze "odměněn" pokutou 1 mld euro, avšak to jsou pouhé 4% jeho obratu. AMD je proti intelu řádově menší firma, která nemá vlastní fabriky na výrobu křemíku, takže pro ně bylo dost těžké takovému Gigantovi konkurovat.
      7.8.2017 Tak to vypadá, že po vydání Zenu od AMD se konečně v intelu pohnuly ledy. Po letech stagnace tu najednou máme core i3 s odemčeným násobičem, chystá se nové 4-jádrové core i3 s HT, core i5 a i7 povýší na 6 jader, objevilo se nové core i9 (Skylake-X) pro high-end PC až s 18 jádry + HT a také ceny začaly pomalu klesat. Co víc si přát, až na tu tragickou (ne)kompatabilitu socketů a chipsetů (že by záměrně?)...

      13.3.2017 AMD vrací úder, přichází Ryzen a někomu z toho možná praskne žilka :). Někdy v loni jsem zaznamenal mumlání o nové architektuře Zen, že to prý bude něco zcela nového a úžasného, ale moc jsem v to nevěřil a nevěnoval tomu více pozornost. Začátkem letošního roku už ale nešlo ten hype přehlédnout a začaly se objevovat různé leaknuté testy, podle kterých to opravdu vypadalo na revoluci. 2. března pak AMD oficiálně uvedlo do prodeje tři 8-jádrové top modely Ryzen 7 (1700 na 3,0 / 3,7 GHz, 1700X na 3,4 / 3,8 GHz a 1800X na 3,6 / 4,0 GHz) a objevily se též první recenze a testy.
      Oproti předchozím neúspěšným pokusům vzalo AMD návrh architektury Zen pěkně od podlahy a vytyčilo si smělý cíl překonat IPC předchozího Excavatoru alespoň o 40%. A výsledek předčil jejich vlastní očekávání, když dosáhli zrychlení až o 52%. Navíc díky konkurenceschopné 14nm výrobní technologii od GlobalFoundries se daří držet spotřebu na uzdě. Nejnižší model R7 1700 se dokonce vejde s TDP do 65 W.
      Základem Ryzenů je 4-jádrový modul CCX (CPU CompleX) se 4 x 64kB instrukční + 32kB datové L1 write-back cache, 4 x 512 KB L2 cache a 8 MB L3 cache, 2-kanálovým řadičem DDR4 2666 MHz efektivně a 24 linkami PCI-E 3.0. Každé jádro podporuje obdobu intelího Hyper-threadingu (zde zvaného SMT) a výčet instrukčních sad je podobný jako u intelu. 8-jádrové procesory obsahují 2 CCX moduly propojené rychlou sběrnicí Infinity Fabric, avšak navenek nabízí stále jen 2-kanálový řadič pamětí a 24 PCI-E linek. U serverových procesorů Naples s až 32 jádry bude k dispozici až 64 PCI-E linek a 8-kanálový paměťový řadič. Ryzen pokračuje dále v trendu integrace periferií směrem k SoC a oproti intelu v sobě navíc obsahuje řadič 4 x USB 3.1 gen 2, SATA3 a NVMe (SATA3 a NVMe využívají 4 PCI-E linky procesoru a umožňují kombinace x4 NVMe bez SATA3 nebo x2 NVMe + 2 x SATA3 nebo 2 x SATA3 + 2 x PCI-E). Tím se opět zjednodušuje design základních desek, kde lze použít minimalistické chipsety X300, A300, B300 (vhodné pro mini-ITX MB) propojené s procesorem pouze přes rychlou SPI sběrnici, čímž se ušetří 4 PCI-E linky procesoru, které jsou jinak potřeba pro komunikaci s klasickými desktopovými chipsety (low-end A320, mid-range B350, high-end X370). Všechny modely Ryzenu mají odemčený násobič a podporu XFR (eXtended Frequency Range), která může přidat až 50 resp. 100 MHz (X-kové verze) navíc po 25MHz krocích, pokud je čip dobře chlazen. Nepřekvapivě si nový Ryzen vyžádal nový socket AM4, ale AMD slibuje, že zas na nějakou dobu vydrží.
      Nové procesory Ryzen 7 jsou už běžně k dostání v našich obchodech a cena se pohybuje cca od 9800 Kč za model 1700 do 15000 Kč za top model 1800X. 4 a 6-jádrové Ryzeny 5 s 8 a 16MB cache o max. frekvenci 4 GHz budou brzy následovat a cenu bych tipoval tak od 5000 Kč. UPDATE: už byly vydány 4 modely Ryzen 5 a jsou ke koupi od 5200 do 7600 Kč. Nakonec přijdou 4-jádrové Ryzeny 3 bez SMT s 8MB cache. A jak dopadlo srovnání výkonu? Inu, v masivně multi-thred aplikacích uspěl Ryzen velmi dobře, dokonce třeba v testu video enkodéru HandBrake dosáhl R7 1800X více FPS než 10-jádrový intel Core i7-6950X s HT za cca 40000 Kč. Naopak v 1-vláknových testech (PiFast) byl Ryzen pomalejší, např. proti Core i7-6900K o 14% a proti nejrychleji taktovanému Core i7-7700K na 4,5 GHz o 41%. To se též promítlo do herních testů, kde na tom byl R7 1800X někdy hůře, než 4-jádro Core i5-7600K bez HT na na 4,2 GHz. Možnosti přetaktování na vzduchu nejsou moc velké, někomu se povedlo dosáhnout 4,3 GHz @1,45 V. S pomocí kapalného dusíku se podařilo zatím dosáhnout 5,8 GHz. Spotřeba je zhruba srovnatelná s podobnými procesory intelu a teploty na základních taktech vesměs i nižší. Na tomto videu je názorně vidět, že čip je k IHS poctivě připájený.
      I když Ryzen není absolutním vítězem, důležitým ukazatelem je poměr cena/výkon, který je u Ryzenu výrazně lepší. Takže konkurence je zpět a intel bude muset zlevňovat, (nejen) proto AMD fandím. Osobě kdybych teď pro sebe kupoval nový CPU, zůstal bych u intelu a šel do nejrychlejšího 4-jádra Core i7-7700K, protože mi dost záleží na single-thread výkonu. Ale myslím, že mi moje Sandy Bridge Core i7-2600K, kterému můžu v klidu taktnout jedno jádro na 5,1 GHz, ještě nějaký ten rok vydrží. Nemyslím si, že by brzo přišla nějaká lepší technologie, která by umožnila zásadně zvýšit frekvenci nebo IPC na jádro. Zde přidávám odkaz na praktické postřehy a testy Ryzenu 1700 kolegy Zenitha.
      4.7.2017 AMD vydalo řadu procesorů Ryzen Pro. Oproti základní řadě mají navíc podporu hardwarového šifrování RAM (pomocí 128-bitového AES), které funguje nezávisle na OS a dále delší záruku a delší zaručenou dostupnost. Na druhou stranu mají bohužel nižší taktovací frekvence, které dosahují max. 3,8 / 3,4 GHz při TDP 95 W.
      27.7.2017 AMD vydalo nejnižší řadu procesorů Ryzen 3, konkrétně 2 modely: R3 1200 s takty 3,1 / 3,4 GHz za 3000 Kč a R3 1300X s takty 3,5 / 3,7 GHz za 3500 Kč, oba s 8 MB L3 cache a TDP 65 W. R3 1300X se dá s trochou štěstí díky XFR popohnat v turbu až na 3,9 GHz. Ryzeny 3 vznikly jako nevyhnutelný odpad výroby vyšších modelů R5 a R7, obsahují tedy stejné 2 CCX moduly, kde jsou některá jádra deaktivována, stejně tak je vypnuto SMT. Do kancelářských low-end PC mají tyto procesory nevýhodu v absenci integrovaného GPU. Naopak do high-end PC míří chystaný ThreadRipper, který má jít do prodeje 10.8.2017. Nabídne 16 jader / 32 vláken, takty 3,4 / 4,0 GHz, 32 MB L3 cache, 4-kanálový řadič DDR4 a 64 PCI-E linek při TDP kolem 180 W za cenu cca 1000 $. Celkem nepřekvapivě bude vyžadovat nový socket TR4, který je výrazně větší než AM4. Jeho vnitřnosti po odvíčkování si můžete prohlédnout zde (2 ze 4 křemíkových čipů jsou nezapojené a patrně vadné jen pro lepší držení IHS).
      7.8.2017 Jak už to tak bývá, žádná nová CPU architektura se neobejde bez chyb a AMD Ryzen není výjimkou. Po odhalení a opravě chyby instrukce FMA3 tu máme další problém, který se objevil ve FreeBSD při plném vytížení procesoru. AMD problém řeší, zatím jako workaround by mělo pomoci vypnout SMT.



Zpět

Aktualizováno 18.10.2017 v 00:58

Sportovní výživa a posilovací stroje Ronnie.cz