RayeR's homepage/Zamyšlení nad procesory intel

Zamyšlení (nejen) nad procesory intel
      13.2.2002 Dříve jsem na procesory intelu nenechal dopustit. A to z několika dobrých důvodů. Člověk (za sice poněkud vyšší cenu) dostal kvalitní procesor s rychlým koprocesorem, který šel výborně přetaktovat a přitom produkoval méně tepla než konkurence. Navíc pro intely byl dostatek kvalitních motherboardů (např. s legendárním chipsetem 440BX) s bezproblémovým chodem AGP a dostatkem slotů ISA.
      Časy se však mění a intel nám trochu usnul na vavřínech, díky čemuž největší konkurent AMD dosáhl doposud největšího významu. Nedávno mě překvapil článek o low-end procesoru VIA C3. Jeho výkon je bohužel degradován hrozně pomalým FPU avšak datová propustnost by díky 133MHz FSB nemusela být vůbec špatná. K dobru mu můžeme také připočíst instrukční sadu 3DNow! a kompatabilitu se Socket 370. Zato se však může chlubit 0,13µm technologií, díky čemuž si vystačí s pasivním chladičem (ztrátový výkon 733MHz CPU je 6 - 10 W). Navíc má procesor dokonce softwarově nastavitelný takt a tak lze ještě spotřebu snížit. To bych od VIA nečekal.
      A zatím intel lpí na své už zastaralé 0,18µm technologii a problémy s nadměrným teplem (u Pentia 4 až 50 W) řeší zavedením nového standardu ATX 2.0 a tak si patrně budeme muset koupit nové kastle.
      Právě uváděním stále nových a přitom nekompatabilních standardů mě intel velice popouzí. Stačí se podívat na vývoj patic procesorů. Socket 7 sloužil už dost dlouho klasickým pentiím (AMD ho ještě drželo pár let při životě procesory K6-II a K6-III) a tak pro novou generaci procesorů byla potřeba nová patice.
      Intel tedy vyvinul dosti odlišný Slot 1 pro Pentium II, které mělo externí L2 cache mimo čip CPU. Za chvíli zjistil, že výroba těchto procesorů je moc drahá a vrátil se ke klasické patici v podobě Socket 370. Zpočátku vyráběl procesory PPGA a poté sice se stejnou paticí avšak nekompatabilní procesory FC-PGA. Tím si přišli na své i výrobci redukcí. Redukce pro Slot 1 jsou celkem rozšířené, hroší je to však s redukcí PPGA:FC-PGA. Navíc nově plánované Pentium III s jádrem Tualatin (0,13 µm) bude vyžadovat opět nový Socket FC-PGA II a napěťový regulátor VRM s krokem 25 mV. Ani ti, co vsadili rovnou na Pentium 4 nebudou mít pokoje, protože součastné P4-Willamette pro Socket 423 bude nahrazeno novým P4-Northwood pro Socket 478 vyžadujícím i nový chipset. Myslím, že spíše než krátkozrakost intelu, je to jeho způsob, jak z lidí neustále tahat peníze...
      Konkurence AMD je v tomto ohledu mnohem věrnější svým standardům a vystačí si se starším Slotem A a součastným Socketem A. Procesory AMD jsou na stejných frekvencích už dokonce rychlejší než intely, včetně FPU (a to při znatelně nižší ceně). Přetaktovatelnost není sice tak dobrá, ale díky možnosti jednoduše odemknout násobič (což se na intelech ještě nikomu nepovedlo) lze přetaktování lépe rozvrhnout mezi FSB a jádro. AMD také používá mnohem propustnější FSB 100 / 133 MHz DDR (200 / 266 MHz efektivně) ve spojení s levnějšími pamětmi DDR SDRAM oproti drahým Rambus RDRAM na které se zaměřuje intel. Tepelná ztráta procesorů AMD je o něco větší než u intelů. Nepočetná nabídka základních desek pro Socket A se přece jen rozšiřuje a najdou se i nějaké se slotem ISA (např. Abit KT7E). Využívají chipsety VIA, AMD a připravuje se nForce od nVidie. Jen by mě zajímalo, jak a nakolik bezproblémově implementují AGP (s AGP na chipsetu VIA pro intel CPU jsem si užil problémů dost).
      Prodej low-endových konkurenčních procesorů AMD stále roste a pokud nás běžné uživatele bude intel dále ignorovat, zbyde mu za pár let jen část trhu s Xeony pro servery, což si zas myslím, že by byla škoda. A tak vážně uvažuji, že i přes svou důvěru v intel, při koupi příští základní desky a procesoru už možná budu intel outside...

      25.10.2006 Při rozmýšlení nad nadcházejícím upgradem svého PC jsem se po pár letech vrátil zpět k této úvaze. Vývoj situace v oblasti procesorů mě nijak příliš nepřekvapoval. Intel zatloukl poslední hřebík do rakve Socketu 370 procesorem Celeron/Pentium III Tualatin, což byl na delší dobu poslední kvalitní CPU, který intel vyrobil. Očekávaný nárůst výkonu u Pentia 4 nebyl tak velký, jak se čekalo. Celeron Tualatin přetaktovaný na stejnou frekvenci jako P4 byl v řadě programů rychlejší než jeho nástupce. Asi taky proto se intel snažil tento debakl zamaskovat rychlým ukončením Tualatinu a masivní mediální kampaní propagující P4.
      Intel naháněl výkon zejména zvyšováním frekvence (až někam do 3,8 GHz), což ale šlo ruku v ruce s růstem spotřeby a problematickou uchladitelností jádra (thermal throttling). Tehdá jsem si stěžoval, že 50 W je hodně a přitom Pentiu 4 D se podařilo překonat hranici TDP 100 W. Konkurent AMD mezitím neustále nabíral na síle a dokazoval, že umí podat stejný výkon při znatelně nižší frekvenci díky lepší architektuře. Ale čísla GHz se prodávají líp, i když i řada běžných uživatelů už tenhle trik prokoukla. Intel také za tu dobu stihl 2x změnit Socket z původního 423 přes 478 po LGA 775. Já jsem se rozhodl celou generaci P4 (NetBurst) ignorovat a provedl jsem pouze menší upgrade z Celeronu Coppermine na Celeron Tualatin 1100@1466 MHz, který mi necelé 2 roky dobře sloužil v MB Abit BX133-Raid.
      Když už jsem nad intelem pomalu lámal hůl, objevil se nový procesor Pentium M určený zejména pro notebooky (Socket 479), spolu s novým chipsetem známý jako platforma Centrino. Tento CPU od návrhářů izraelské divize intelu dosahuje na stejné frekvenci oproti P4 znatelně většího výkonu a to při menší spotřebě energie. Nejedná se přitom o kdovíjakou novinku, vzniklo totiž vylepšením jádra starého dobrého Pentia III, kterému se přidala veliká L2 cache, propustnější QDR sběrnice a výroba probíhala 130, 90 a 65nm technologií. Bohužel na desktopy se Pentium M moc nerozšířilo (intel dobře věděl, že si to vzhledem k P4 nemůže dovolit), neb základních desek je dosti po málu (asi s jediným chipsetem i855). Také se objevila redukce do Socketu 478. U nás však ne moc dostupná a předražená (jak jinak) a byla potřeba i podpora v BIOSu, kterou mnoho desek nemělo.
      Doufal jsem, že intel časem pochopí, že s P4 šlápl vedle a bude dále rozvíjet Pentium M. A tak jsem se také dočkal (zřejmě díky tomu, že intel narazil na frekvenční strop současné křemíkové technologie :). Izraelci se činili a přišli s novými procesory Core Duo a Core Solo pro notebooky (kódové jméno Yonah, Socket 479) a konečně Core 2 Duo (Conroe / Allendale, Socket LGA 775) pro desktopy a notebooky (Merom, Socket 479). Dochází také k rozmachu multiprocesingu. 2 jádra už nabízelo Pentium 4 D, ale v případě Core 2 Duo ani není dostupná jednojádrová verze a co nevidět tu bude čtyřjádrová. Otázka je, kolik současných programů to plně využije. Předpokládám však, že masivní rozšíření více jader donutí programátory nad tím zapřemýšlet.
      V současnosti jsou pro desktopy dostupné procesory Core 2 Duo E6300, E6400, E6600 a E6700 pracující na frekvencích 1,86, 2,13, 2,40 a 2,67 GHz. Na první pohled jsou to čísla menší, výkonově si ale E6700 poradí s Pentiem 4 D na 3,6 GHz i Athlonem 64 FX-60 na 2,6 GHz. Max. ztrátový výkon se pohybuje kolem přijatelných 65 W díky 65nm technologii (to dává také velký potenciál přetaktování). EIST (Enhanced Intel SpeedStep) umožňuje dynamicky za chodu měnit frekvenci (snížením násobiče) a napětí jádra. Core 2 Duo je vybaveno 2x 32 kB L1 cache a 2 nebo 4 MB sdílené L2 cache. Díky tomu si jádra mohou rychleji vyměňovat data, aniž by se tím zatěžovala pomalá FSB. V případě, že se využívá jen jedno jádro, je mu celá L2 cache k dispozici a tak ani část nezahálí. Instrukční sada byla rozšířena o SSE4 a 64-bitové rozšíření EM64T (Extended Memory 64 Technology) převzaté od AMD. Sběrnice FSB běží na 266 MHz QDR (1066 MHz efektivně), což spolu s velkou a rychlou cache zvětšuje propustnost paměťového subsystému. Nové intelí chipsety navíc mají 2-kanálový řadič paměti, který při použití 2 stejných SDRAM modulů přidá dalších pár desítek %.
      Zmínil jsem, že procesor Core 2 Duo je určen pro Socket LGA 775 (stejně jako nová Pentia 4), ale nebyl by to intel, kdyby s uživateli stávajících desek řádně nevyjebal. Ano historie se opakuje. Intel trochu pozměnil pár pinů a specifikaci napájení, díky čemuž se C2D v těchto deskách vůbec nerozjede a uživatel má prostě smolíka. Není to ani problém chipsetu, jak se můžeme někde mylně dočíst, jen je potřeba implementovat novou specifikaci napěťového regulátoru VRM. Možná že by to ale šlo i jinak? Výrobci postupně vydávají nové revize svých desek s podporou C2D i zcela nové desky, nejčastěji s PCI-E chipsety i945, i975 a i965 (kde se vyskytly nějaké chybky a čeká se na další stepping).
      Celkově se tedy procesor Core 2 Duo velmi vydařil a to mě inspirovalo k dlouho odkládanému kompletnímu upgradu. Léta jsem váhal, ale nijak toho nelituju, že jsem P4 úplně vynechal. Přechod k AMD se tedy nekoná :). Nakonec jsem se podle ceny rozhodl pro C2D E6400 na 2,13 GHz s 2 MB L2 cache, což je můj už šestý procesor od intelu, pro nějž jsem vybral základní desku Asus P5LD2 s chipsetem intel 945P + ICH7R. Po roce a půl jsem základní desku vyměnil za Gigabyte GA-P31-DS3L s chipsetem intel P31, který podporuje novější 45nm C2D procesory, z nichž jsem si vybral rychlé dvoujádro E8500 na 3,16 GHz s 6 MB L2 cache, později nahrazené nejvyšším modelem E8600 na 3,33 GHz.

      7.10.2015 Intel z úspěchu procesorů Core 2 Duo a Core 2 Quad těžil po mnoho let a velmi se mu dařilo. Koncem roku 2008 pak vydal další generaci procesorů Core i5 a i7 založených na nové revoluční architektuře Nehalem. Její hlavní novinky jsou integrace 2 - 3 kanálového paměťového řadiče DDR3 SDRAM (AMD už integrovalo paměťový řadič do svého Opteronu o mnoho let dříve a po vyladění počátečních potíží se to ukázala být ta správná cesta) a změna architektury cache na tříúrovňovou, což zhruba zdvojnásobilo paměťovou propustnost proti C2D. Tím se výrazně zjednodušil design základních desek, kde zmizel severní můstek MCH (Memory Controller Hub) a jižní můstek ICH (I/O Controller Hub) se změnil na PCH (Platform_Controller_Hub) s kterým procesor komunikuje přes QPI (QuickPath Interconnect). Novější rodina procesorů Lynnfield do sebe navíc integruje 16-linkový PCI-E 2.0 řadič. Na komunikaci s PCH tak stačí pomalejší sběrnice DMI (Direct Media Interface). Typická konfigurace Core i7 pro desktopy má 4 jádra (navíc se zpět do hry vrací Hyper-threading) s 8 MB sdílené L3 chache, kde každé jádro má dále k dispozici dedikovanou 64 kB L1 cache a 256 kB L2 cache. Přibyly též nové instrukce SSE4.2 a HW podpora virtualizace VT-x. Samozřejmě nechybí (tentokrát celkem oprávněně) nový socket a to hned ve 3 variantách: LGA 1156 pro desktopy, LGA 1366 pro výkonné pracovní stanice a servery a LGA 1567 pro high-end servery. Výrobní proces zůstává na 45 nm, což poněkud limituje frekvenční růst na max. 3,33 GHz.
      Je též zajímavé, jak intel změnil svůj postoj k přetaktování. Od nekompromisního uzamčení násobiče směrem nahoru přešel k technologii Turbo Boost, která je defakto mírným přetaktováním v mezích zákona (rozuměj limitu TDP). V případě potřeby (skrze požadavek OS) se tak dynamicky zvedne násobič a Vcore. Dosažená turbo frekvence závisí na počtu aktivních jader (maximální turbo frekvence dosáhne jen jedno jádro) a na odebíraném proudu, příkonu a teplotě. Jelikož z této architektury zmizela FSB, je zde frekvence jádra odvozena od base clock 133 MHz. Z ní se odvozuje též frekvence PCI-E a dalších kritických periferií, takže s ní nejde moc hýbat. Pokud to základní deska umožňuje, lze base clock zvýšit jen o pár MHz.
      Později v roce 2010 došlo ke zmenšení výrobní technologie na 32 nm pod označením Westmere. Max. frekvence se tak posunula na 3,86 GHz (u některých vzorků Xeonů až 4,4 GHz). Do rodiny Core i5 a i7 přibyl ještě očesaný 2-jádrový procesor i3. Instrukční sada byla rozšířena o podporu AES Zásadní novinkou byla integrace grafického jádra do některých procesorů (mobilní rodiny Arrandale a desktopové rodiny Clarkdale), které využívá sdílené operační paměti i výhody L3 cache. Jedná se o multičipové procesory, kde CPU bylo vyráběno novější 32nm technologií zatímco GPU starší 45nm technologií.
      Začátkem roku 2011 vydal intel novou architekturu Core 2. generace s názvem Sandy Bridge. Nejedná se už o žádnou velkou revoluci, ale spíše drobnější vylepšení předchozí architektury. Kromě optimalizací výpočetních jader přibyla nová 256-bitová instrukční sada AVX (Advanced Vector Extensions) a bezpečnostní technologie TXT (Trusted Execution Technology) spolupracující s TPM (Trusted Platform Module). Nejvíce změn prodělalo grafické jádro HD Graphics s podporou kodeku H.264, které se stalo u některých procesorů nedílnou součástí čipu. Výrobní technologie zůstává na 32 nm a nejvyšší modely dosahují turbo frekvence 4,0 GHz. 4-jádrová varianta s 8 MB L3 cache obsahuje více než 1 miliardu tranzistorů. Nechybí též "oblíbená" změna socketu na LGA 1155 pro desktopy a LGA 2011 pro výkonné pracovní stanice a servery. Alespoň že intel myslel i na nadšence overclockery a vydal řadu procesorů 2xxxK s odemčeným násobičem (tzn. lze nastavit vyšší než jmenovitou turbo frekvenci a to pro každé jádro zvlášť bez ohledu na TDP), avšak za patřičně vyšší cenu. Při upgrade PC koncem roku 2015 jsem si jeden takový model Core i7-2600K pořídil z druhé ruky a myslím, že i dnes výkonově nijak moc nezaostává. S trochou přetaktování bez problému dožene i současné top modely Core i7.
      Po roce intel zmenšil výrobní technologii na 22 nm, která poprvé využívá 3D tri-gate tranzistory. 3. generace Core nese název Ivy Bridge a přináší pár dalších vylepšení jako třeba nový řadič PCI-E 3.0 a instrukci RdRand. Nejvyšší modely dosahují jen nepatrně vyšší turbo frekvence 4,1 GHz proti Sandy Bridge a taktéž nárůst výkonu CPU jen o pár %. Naopak u GPU je zrychlení znát. Zvýšil se počet EU, podpora DX11, OpenGL 4.0, OpenCL 1.1 a 4k videa, ale pořád je to někde jinde, než externí PCI-E VGA. Ale pro méně náročnější uživatele, zejména u notebooků to vystačí a ušetří baterie. Výkonnější notebooky integrují samostatný GPU čip od ATI/nVidie, na který lze dynamicky přepnout v případě spuštění nějaké náročnější 3D aplikace. Patice tentokrát zůstala stejná, takže s patřičnou podporou BIOSu mohou upgradovat i majitelé starších desek pro Sandy Bridge. Overclockeři ale z nových CPU nebyly moc nadšeni, protože při přetaktování velmi rychle rostla teplota jádra, bez ohledu na teplotu chladiče. Zjistilo se, že zde intel místo pájení IHS ke křemíkovému čipu použil nepříliš kvalitní teplovodivou pastu. Obnovila se tak stará známá praktika sundávání IHS z dob Pentia III Tualatin a s dobře nakontaktovaným chladičem s měděnou základnou bylo možno výrazně snížit teplotu jádra CPU. I po této úpravě nešlo přetaktování tak dobře, zřejmě kvůli větší hustotě integrace, větším leakage proudům a nutnosti více zvyšovat Vcore. Později jsem si přečetl zajímavý článek o pájení CPU jader, které není vůbec technologicky jednoduchý proces a zejména u menších jader přináší vážné komplikace s životností.
      Intel najel na pravidelný proces aktualizací svých CPU zvaný tik-tak. Tik znamená změnu technologie výroby (jemnější litografie), do které překlopí předchozí generaci s menšími vylepšeními. Tak zas znamená výraznější změnu samotné architektury vyrobené na odladěné technologii. V létě 2013 vydal novou architekturu Core 4. generace s názvem Haswell. Intel se tentokrát popral s velkou výzvou - podařilo se mu do procesoru integrovat napěťový regulátor FIVR (Fully Integrated Voltage Regulator), celá prezentace zde. Ten se sice neobejde bez dalšího předregulátoru na základní desce (pouštět do CPU rovnou 5 či 12 V by bylo na dané technologii nereálné), ale umožní tak procesoru lépe zvládat dynamické proudové špičky při změně zátěže, rychlejší přechody mezi úspornými a výkonovými stavy a jemnější změnu Vcore. FIVR se skládá celkem z 320 fází (včetně integrovaných planárních cívek), každá skupina po 16 fázích dodá proud až 25 A s spínací frekvence se pohybuje v rozsahu 30 - 140 MHz. To je řádově jinde, než běžný 4-fázový VRM s efektivní frekvencí 1 MHz. To se samozřejmě neobešlo bez změny patice na LGA 1150 pro desktopy a LGA 2011-v3 pro servery, je sice fyzicky stejná jako LGA 2011-v1, ale elektricky kompatabilní není. Dále přibyly nové instrukční sady AVX2, FMA3, TSX (avšak kvůli HW chybě nepoužitelné) a max. turbo frekvence byla zvýšena na 4,4 GHz. Nejvíce vylepšení bylo opět v GPU. Pro některé mobilní verze procesorů byla použita nová grafika Iris Pro 5200 se 128 MB eDRAM integrované přímo v BGA pouzdru (avšak jako samostatný kus křemíku vedle CPU). U novější řady procesorů Haswell Refresh z roku 2014 byla použita kvalitnější tepelná pasta mezi čipem a IHS.
      Dalším tikem byl přechod na 14nm litografii koncem roku 2014, kdy byla vydána 5. generace Core s názvem Broadwell. Změny architektury jsou spíše jen kosmetické. Vyjma prvních Broadwellů byla opravena chyba v implementaci TSX, přibyla nová instrukce RdSeed pro generování náhodných čísel z interního šumového generátoru a byla implementována nová bezpečnostní funkce SMAP, která by měla zabránit nechtěnému spuštění kódu z paměti uživatelského procesu v kernel módu (exploity k eskalaci oprávnění). To samozřejmě vyžaduje zapracovat podporu SMAP i do OS. Procesory s jádrem Broadwell byly cíleny zejména do mobilní sféry (pouzdra BGA) a do serverů (socket LGA 2011-v3). Pro desktopy (socket LGA 1150) byly určeny pouze 2 modely Core i5 a i7 s integrovanou grafikou Iris Pro 6200, která má k dispozici 128 MB eDRAM (stále 2 čipy v 1 pouzdře jako u Haswellu). Max. turbo frekvence dosahuje pouze 3,7 GHz u desktopových CPU a 4,0 GHz u serverových CPU, možnosti přetaktování jsou mizerné.
      Po odladění 14nm výrobního procesu uvedl intel koncem léta 2015 novou architekturu Core 6. generace s názvem Skylake, která přináší některé zásadní změny. Intel se rozhodl z blíže neurčeného důvodu odstranit z jádra procesoru svůj unikátní design integrovaného regulátoru FIVR, který u Haswellu tolik opěvoval. Možná to zhoršovalo výtěžnost výroby nebo se předpokládané výhody v reálu ukázaly býti menší a nevýhody větší, než se původně čekalo. To s sebou, jak je u intelu zvykem, neslo další změnu patice na LGA 1151 pro desktopy a pro servery se chystá během roku 2017 nový socket LGA 2066. Kapánek problémovou změnou se ukázalo ztenčení substrátové PCB procesoru, což vedlo v některých případech k nepříjemným deformacím vlivem přítlaku chladiče. Další zásadní změnu prodělal integrovaný paměťový řadič, který nyní podporuje paměti DDR4 a DDR3L, které pracují s nižším napájecím napětím (1,2 V resp. 1,35 V) o proti stávajícím DDR3 (1,5 V). Přestože intel DDR3 oficiálně nepodporuje (kvůli potenciální možnosti poškození CPU vyšším napětím na paměťové sběrnici), někteří výrobci MB přesto takové základní desky vyrobili. V současnosti už cena DDR4 pamětí klesla, takže nemá cenu to riskovat. Dále přibyla nové instrukční sada AVX-512 a bezpečnostní rozšíření MPX a SGX pro kontrolu mezí a lepší ochranu paměti uživatelských procesů. Konstantně se vylepšuje GPU - HD/Iris Graphics 5xx s podporou DX12, OpenGL 4.5, OpenCL 2.0, kodeků VP8, VP9 a H.265 a 128 MB eDRAM u některých modelů. Max. turbo frekvence se mírně zvýšila na 4,2 GHz (spolu s TDP), což stále nedosahuje taktů Haswellu ale i tak dosahuje průměrného nárůstu single-thread výkonu asi o 6%.
      Intel se opozdil s vývojem 10nm výrobního procesu a tak trochu naboural stávající zaběhnuté tik-tak schéma vydáním 7. generace Core s názvem Kaby Lake na odladěném 14nm procesu koncem léta 2016. Přináší pouze drobné změny a vylepšení, převážně v GPU části (podpora HDCP 2.2, HW kódování H.264 a H.265 v 10-bitové hloubce, které několikanásobně snižuje spotřebu procesoru při přehrávání videa oproti SW implementaci). Instrukční sada a patice LGA 1151 zůstala beze změn, pouze se zvýšila max. turbo frekvence na 4,5 GHz a rychlost přechodu z jedné frekvence na druhou. To mi přijde trochu málo. Předpokládá se, že i další generace Coffee Lake bude vyráběná též 14nm procesem a půjde o další recyklaci Skylake. Cannon Lake na 10 nm procesu bude nejspíš až v roce 2018.
      Intel u každé nové generace slibuje výrazný nárůst IPC, ale skutečnost v reálných aplikacích je jiná, single-thread výkon roste od dob Sandy Bridge jen velmi málo (při stejné frekvenci) a samotná max. frekvence se od dob Haswellu také zvýšila jen nepatrně. Na dlouhodobější srovnání výkonu různých generací Core se můžete podívat zde, zde a zde. Ceny intelích procesorů se přitom dlouhodobě drží na výši jako nikdy předtím, což je důsledek toho, že intelu chybí pořádná konkurence. Kvalita ceně bohužel občas moc neodpovídá, jak se ukázalo třeba v aféře umírajících serverových Atomů C2xxx těsně po záruce. Vývoj AMD jsem moc nesledoval, protože od dob Core 2 bylo neustále pozadu a nezměnily to ani všechny pokusy o vícejádrové procesory Bulldozer, Piledriver, Steamroller a Excavator dohnané do extrémních šíleností typu 8-jádrový 32nm přímotop AMD FX-9590 na 4,7 / 5,0 GHz s TDP 220 W. Nutno podotknout, že intel házel AMD dost nepěkně klacky pod nohy svými neférovými obchodními praktikami, za což byl posléze u soudu "odměněn" pokutou 1 mld euro, avšak to jsou pouhé 4% jeho obratu. AMD je proti intelu řádově menší firma, která nemá vlastní fabriky na výrobu křemíku, takže pro ně bylo dost těžké takovému gigantovi konkurovat.
      7.8.2017 Tak to vypadá, že po vydání Zenu od AMD se konečně v intelu pohnuly ledy. Po letech stagnace tu najednou máme core i3 s odemčeným násobičem, chystá se nové 4-jádrové core i3 s HT, core i5 a i7 povýší na 6 jader, objevilo se nové core i9 (Skylake-X) pro high-end PC až s 18 jádry + HT a také ceny začaly pomalu klesat. Co víc si přát, až na tu tragickou (ne)kompatabilitu socketů a chipsetů (že by záměrně?)...
      4.1.2018 Začátkem nového roku byla zveřejněna docela závažná bezpečnostní díra v CPU bloku TLB cache, kdy uživatelský proces může vyčíst z cache nějaká data kernelu, která se tam dostala při spekulativním čtení, neboť procesor v tomto případě neřeší úrovně oprávnění (patrně kvůli rychlosti operace). Bylo prokázáno dokonce více typů těchto chyb a dostaly jména Meltdown a Spectre, viz Google Project Zero. Názorně to popisují tyto 2 příspěvky od xvaska a Jana Ringoše. Prý jsou postiženy všechny x86 CPU intelu od roku 1995, tj. architektura P6 vyjma některých starších in-order Atomů. Některé z chyb typu Spectre se týkají i AMD, IBM Power a novějších ARMů, nikoliv však třeba ARM Cortex-A7 a Cortex-A53 použitých v Raspberry Pi 2 a 3. Aktualizace info zde. Intel o chybě věděl už od loňského června (a prý o tom řekl dříve Číně než domácím USA), patrně se pokoušel vyřešit problém aktualizací mikrokódu, ale nepovedlo se a je nutný patch do jádra OS. Ten při přepínání kontextu invaliduje cache, čímž značně snižuje výkon CPU, cca o 5 - 30%. Patch pro Linux kernel je volitelný a pro Windows 10 / Server 2016 (pro starší Windows zatím nic) byla vydána záplata KB4056892, která však na některých PC s CPU AMD dojebe OS. Stav zranitelností vašeho systému si můžete ověřit tímto linuxovým skriptem nebo utilitou InSpectre pro Windows, exploity se už na Internetu pomalu rojí. BTW než se problém zveřejnil, stihl šéf intelu včas prodat většinu svých akcií, jejichž hodnota následně ze dne na den klesla asi o 7%.
      29.1.2018 Snaha intelu opravit chybu novým mikrokódem se zatím moc nedaří, uživatelé postupně hlásí různé nestability svých PC, které před updatem neměli. Měření poklesu výkonu různých CPU v různých aplikacích viz zde a zde. Je s podivem, že tak velká společnost nebyla schopná svou aktualizaci před vydáním řádně otestovat. Micro$oft i Red Hat nakonec problémové aktualizace stáhli a sám intel je už také nedoporučuje dále instalovat, ale už snad našli příčinu problému a pracují na dalším update. Na některé starší CPU se ale už záplaty dělat nebudou. Zevrubný popis chyb a současný stav oprav pěkně shrnuje přednáška Vojtěcha Pavlíka z letošního Installfestu. Dále intel oznámil, že prý ještě koncem letošního roku vydá hardwarově opravené procesory.
      28.3.2018 Byla publikována další zranitelnost CPU BranchScope, podobná předchozí Spectre 2, která využívá PHT (Pattern History Table) v prediktoru skoků. Zatím byla potvrzena na CPU intel řady Skylake, Haswell a Sandy Bridge. Podařilo se přečíst data z paměti chráněné SGX (Software Guard Extensions) a patrně obejít randomizaci paměti ASLR. Dále se ukázalo, že Micro$oft svou lednovou záplatou proti Meltdownu na Windows 7 64-bit vytvořil mnohem větší bezpečnostní díru, když změnou 1 bitu odemkl přístup k tabulce stránek jádra i pro uživatelské procesy, čímž umožnil ničím neomezené čtení i zápis celé paměti a to mnohem rychleji a pohodlněji než přes Meltdown. Testovací prográmek na tuto zranitelnost je zde. Micro$oft už na to vydal rychlou opravu KB4100480 opravy...
      20.11.2018 Objevených HW zranitelností v CPU neustále přibývá a máme tu další nazvanou PortSmash, která umožňuje na CPU se zapnutým Hyper-threadingem číst jednomu procesu paměť druhého procesu na stejném fyzickém jádře. Využívá opět postranní kanál měření času vykonávaných instrukcí a z toho odvozuje vykonávané instrukce na sousedním virtuálním jádře. Chyba byla demonstrována přečtením SSL klíčů z procesu OpenSSL na CPU intel Skylake a Kaby Lake. Na AMD Ryzen zatím potvrzena nebyla.
      15.5.2019 Máme tu další odhalené chyby MDS (Microarchitectural Data Sampling) umožňující neoprávněné čtení cizí paměti, které nejsou zalátané ani na poslední 9. generaci procesorů Core. Měly by být k dispozici opravy pomocí nového mikrokódu a záplat v OS, avšak jen pro Core řady Sandy Bridge a novější. Různé zranitelnosti vašeho CPU a funkčnost záplat v OS si můžete zkontrolovat pomocí programu MDS Tool nebo najít v této velké tabulce.
      29.7.2020 O tom, že intel znovu poněkud usnul na vavřínech, svědčí i výsledkový report Q2, kde bylo ve výhledu oznámeno odložení nového 7nm výrobního procesu, načež akcie inelu během dne prudce spadly o 17% a během dalších dnů se propad zvětšil na 22,5% proti lokálnímu maximu. Naproti tomu AMD ten den poskočilo o 16% a během dalších dnů vyrostlo až o 30%. I v absolutní hodnotě už akcie AMD výrazně překonaly intel: z 59,4$ vs 61,5$ na 77$ vs 48$. Další rána pro intel je, že Apple plánuje změnu CPU ve svých zařízení z intel x86 na vlastní procesory ARM.
      Mezitím konkurenční tlak přinutil intel k navýšení počtu jader, což nastalo v roce 2017 u 8. generace Core s názvem Coffee Lake, stále vyráběné 14nm technologií: Core i3 - 4C/4T, Core i5 - 6C/6T, Core i7 - 6C/12T, Core i9 - 6C/12T. Max. frekvence v boostu (single-core) se zvýšila na 5,0 GHz, L3 cache se zvětšila až na 12 MB. Paměťový řadič podporuje rychlejší DDR4 2400 MHz (i3) a 2666 MHz (i5 - i9). Patice LGA 1151 sice zůstala fyzicky stejná, ale elektricky ~~není~~ kompatabilní a jsou potřeba nové 3xx chipsety. Avšak to se později podařilo vyvrátit, intel totiž provedl pouze softwarový výmrd s uživateli, kterým možnost upgrade na chipsetech 1xx a 2xx uměle zablokoval. Koumáci toto omezení prolomili modifikací BIOSu a ME, Nicméně to zřejmě funguje jen se 4-jádrovými CPU i3.
      V roce 2018 intel uvedl 10nm zmenšeninu Kaby Lake mikroarchiktury pod názvem Cannon Lake, která neměla příliš dlouhého života a patrně se prodával jen 1 mobilní CPU Core i3-8121U (2C/4T, 2,2/3,2 GHz). V témže roce intel také vydal desktopové procesory 9. generace Coffee Lake Refresh, které opět navyšují počet jader až na 8: Core i3 - 4C/4T, Core i5 - 6C/6T, Core i7 - 8C/8T, Core i9 - 8C/16T a velikost L3 cache až na 16 MB. Max. turbo frekvence zůstává 5,0 GHz stejně jako patice.
      V roce 2019 přichází 10. generace Core, kde došlo k rozštěpení dle výrobní technologie: máme tu mobilní 10nm Ice Lake a 14nm desktopové Comet Lake. Opět došlo k navýšení počtu jader a také zapnutí Hyper-threadingu u všech modelů řady Core: Core i3 - 4C/8T, Core i5 - 6C/12T, Core i7 - 8C/16T, Core i9 - 10C/20T a zvětšení L3 cache až na 20 MB. Max. turbo frekvence se zvýšila na 5,3 GHz. Paměťový řadič podporuje rychlejší DDR4 2666 MHz (i3 a i5) a 2933 MHz (i7 a i9). S ohledem na zvýšení TDP až na 125 W došlo ke změně patice na LGA 1200 a také je potřeba nový chipset řady 4xx.
      30.10.2020 Intel na příští rok chystá vydání 11. generace desktopových CPU Rocket Lake s novou mikroarchitekturou Cypress Cove, která slibuje prý 2-ciferné zvýšení IPC. Vzhledem k neschopnosti doladit 10nm technologii na vyšší takty budou i tyto CPU stále na 10x přeleštěné 14nm technologii. Nejvyšší model by měl nabídnout 8 jader / 16 vláken s 512 kB L2 (na jádro) a 16 MB L3 cache, což je polovina jader oproti konkurenčnímu top Ryzenu. Hlavní novinky budou 20 PCI-E 4.0 linek dedikovaných pro VGA (x16) a NVME (x4), dvojnásobná šířka (x8) DMI 3.0 rozhraní pro PCH, 2-kanálový řadič pamětí DDR4-3200, instrukční sada AVX-512 (dříve jen v některých Xeonech) a nové grafické jádro Xe s HW kodeky AV1/H.265 v 4k 60 FPS rozlišní s 10 a 12-bitovou hloubkou a s rozhraními DisplayPort 1.4 a HDMI 2.0b. Výchozí TDP by mělo být 125 W a frekvence v single-core boostu by mohla jít na 5,3 - 5,5 GHz při zvýšení TDP na 250 W, avšak jen po omezenou dobu 56 s. Procesor zachová kompatabilitu předchozím socketem LGA 1200 a chipsety Z490 pro Comet Lake, následně budou nové chipsety řady 5xx. Avšak ne na dlouho, další chystaná generace Alder Lake na konec roku 2021 přijde s novým socketem LGA 1700.
      1.12.2020 Jak Apple naplánoval, tak učinil a nedávno uvedl nový MacBook Air s vlastním procesorem M1. Jde o ARM64 SoC se 4 rychlými jádry Fire Storm a 4 úspornými jádry Ice Storm taktovaný až na 3,2 GHz, vyráběný nejnovější 5nm technologií u TSMC. SoC dále obsahuje proprietární GPU s HW videokodeky, 8 GB UMA paměti LPDDR4X, 12 + 4 MB L2 cache, výpočetní jednotky ISP, DSP, NPU, USB4/Thunderbolt3, PCIe 4.0. Vyššího IPC dosahuje zejména díky RISC architektuře a propracovaného Out of Order zpracování instrukcí. Stávající programy se pouští přes emulátor Rosetta 2. Detailnější technický popis M1 zde a zde. SoC je velmi úsporný - u MacBook Air si vystačí s pasivním chlazením, Pro má větráček, ale netočí s ním moc často. Výdrž baterky se při brouzdání uvádí kolem 15 hodin. Ve výbavě ještě stojí za zmínku 13" Retina displej s rozlišením 2560 x 1600, SSD má jen 256 GB, cena necelých 30000 Kč. Apple nespí na vavřínech a už chystá tučnější verzi SoC M1X s 8 + 4 jádry pro 16" MacBook Pro. Intel tak zřejmě definitivně přišel o jednoho velkého zákazníka...
      14.1.2021 Krize intelu vyústila v zásadní změnu ve vedení společnosti. Stávajícího CEO Boba Swana nahradil Pat Gelsinger, který v intelu dříve pracoval 30 let (od éry 386 do roku 2009, kdy přešel do vedení VMware) a nyní je zpět. Je do něj vkládána naděje, že udělá zásadní změny a vrátí intel zase mezi špičku výrobců CPU. Akcie intelu poskočily o 20%. Bude to mít ale těžké, neboť intel má neustále problémy se svou výrobní technologií 10 a 7 nm tak se počítá s outsourcingem výroby CPU na 3 a 5 nm procesech u TSMC, jenže výrobní kapacity těch nejlepších procesů už má dlouhodobě nasmlouvaná konkurence Apple a ADM. Bude to ale chtít i zásadní změnu architektury (ne jen 100x přeleštěné Core) a patrně přechod na chiplety. Na výsledky si ale budeme muset pár let počkat, to není ze dne na den. Konkurence je potřeba.
      12.4.2021 nVidia oznámila záměr začít vyrábět serverové CPU zvané "Grace" založené na architektuře ARM (nVidia loni započala akvizici britské společnosti ARM, která je však zatím v šetření antimonopolních úřadů). Ty by měly být optimalizované pro AI, zpracování přirozeného jazyka, datacentra a v tomto segmentu by měly být výrazně energeticky efektivnější jak procesory x86. Několik velkých organizací už počítá s těmito CPU na stavbu nejvýkonnějších superpočítačů světa. I další velké firmy provozující datacentra vyvíjí své vlastní serverové ARM CPU, např. Amazon pro své AWS používá kromě CPU od intelu a AMD též vlastní CPU Graviton a Graviton2 (mikroarchitektura ARM Neoverse N1), který by měl mít GPU od nVidie, s níž uzavřel partnerství. Taktéž Micro$oft pro své cloudové služby vyvíjí vlastní ARM CPU. To znamená pro intel další citelné ukousnutí koláče podílu na trhu a to zrovna u CPU, na kterých má největší marže. Intel se rozhodl postavit v Ohiu 2 nové továry na výrobu čipů za 20 mld $, které by mohly nabízet výrobní kapacitu i pro další výrobce. V provozu by měly být v roce 2025. Jen aby za tu dobu intelu ještě více neujel vlak. Akcie intelu dnes klesly skokově o 4%, nVidia poskočila o 5,6%.
      4.11.2021 vydal Intel dlouho očekávanou 12. generaci Core Alder Lake vyrobenou "7nm" technologií (dříve označovanou jako 10nm Enhanced SuperFin). Nejzásadnější změnou je hybridní architektura 2 typů jader (koncept big.LITTLE), kde v 1 CPU máme až 8 výkonných P jader Golden Cove s podporou HT (výraznější nárůst IPC až o 19%) a až 8 slabších úspornějších E jader Gracemont známých z Atomů. Na tuto koncepci ale nejsou zvyklé starší OS a bude potřeba úprava scheduleru, aby nedocházelo k nežádoucím propadům výkonu (plná podpora Thread Directoru je ve Windows 11). Dokonce některé hry používající obskurní DRM nešly spustit, protože se procesu při přepínání mezi jádry mění pod rukama CPUID, jehož změnu ona ochrana kontrolovala. Z podobného důvodu je také zřejmě defaultně vypnuta podpora instrukcí AVX-512, kterou lze na některých deskách zapnout po vypnutí E jader. UPDATE: intel nařídil výrobcům desek podporu AVX-512 vypnout. UPDATE2: intel protlačil, že v nových BIOSech byla podpora AVX-512 kompletně vypnuta pro všechny řady CPU a to i ty bez E jader. A prý u nověji vyráběných CPU je už podpora AVX-512 vypnutá přímo v procesoru, takže už nejde aktivovat ani downgradem BIOSu. Podpora AVX2 zůstává, akorát při něm CPU dosáhne nižší boost frekvence bez ohledu na teplotu. Dále došlo ke zvětšení L3 cache až na 30 MB. Max. turbo frekvence (P jádra) je oproti předchozí generaci o něco nižší - 5,2 GHz v singlethreadu a kolem 4,7 - 4,9 GHz při využití všech P jader. E jádra mají základní frekvenci 2,4 GHz a boost na 3,9 / 3,7 GHz. Avšak v plánu je vydání ještě rychlejší verze, která by mohla boostovat na 5,5 GHz. Zajímavostí také je, že na některých MB je možné pomocí volby "Unlock BCLK OC" skrze změnu frekvence BCLK přetaktovat i nižší řadu CPU Core i5 se zamčeným násobičem na úroveň dražších odemčených K-verzí. Paměťový řadič podporuje jak stávající DDR4 3200 MHz, tak novější DDR5 4800 MHz paměti v 2-kanálovém režimu. PCIe sběrnice též zrychlila, k dispozici je PCIe 5.0 x16 a PCIe 4.0 x4. Komunikaci s novými chipsety PCH řady 6xx zajišťuje DMI 4.0 x8. Integrovaná grafika UHD 770 vychází ze starší architektury Xe. Max. příkon u nejvyššího modelu Core i9 12900K je v základu 125 W a při turbu 241 W, čímž BTW překonává legendární přímotop AMD FX-9590 220W. Došlo samozřejmě i na novou patici LGA 1700. S ohledem na větší rozměry tak bude třeba vyměnit i chladič nebo jeho spony. Bohužel má tato nová patice/pouzdro takovou vadu na kráse, že při zaklapnutí CPU do socketu dojde k prohnutí IHS a tím pádem zhoršení kontaktu s plochou chladiče. Opravdu smutné, že u CPU za stovky $ musel intel šetřit pár centů na nedostatečně masivním IHS a ještě k tomu ta alibistická výmluva.
      12.11.2021 Na integrovaných grafikách v CPU intel 4. generace Haswell (iHD 4xxx a 5xxx) byla objevena bezpečnostní slabina v implementaci DX 12, kterou lze zneužít k eskalaci oprávnění. Intel vyřešil problém po svém - v nových ovladačích prostě podporu DX 12 vypnul. Kdo chce DX 12 přesto používat, musí si stáhnout starší verzi ovladače 15.40.42.5063 z 19.3.2019.
      20.10.2022 vydal Intel po roce další, už 13. generaci Core Raptor Lake vyrobenou mírně vylepšenou technologií intel 7 (dříve označovanou jako 10nm Enhanced SuperFin). Pokračuje v zavedené hybridní koncepci P (až 8 x Raptor Cove) a E (až 16 x Gracemont) jader. Patice LGA 1700 zůstává zachována, stejně jako podpora pamětí DDR4 a DDR5 (zrychlení na 5600 MHz). Max. turbo frekvence (P jádra) se zvýšila na 5,8 GHz v singlethreadu a 5,5 GHz při využití všech P jader. E jádra mají základní frekvenci 2,2 GHz a boost na 4,3 GHz. L3 cache se o něco zvětšila až na 36 MB. Počet PCIe linek (PCIe 5.0 x16 a PCIe 4.0 x4) stejně jako rozhraní s novými chipsety PCH řady 7xx (DMI 4.0 x8) a integrovaná grafika (UHD 770) zůstává beze změny. Oproti předchozí 12. generaci se podařilo zvýšit singlethread výkon asi o 15% a intel tak po delší době srovnává výkon s AMD Zen 4, ovšem za cenu dalšího nemalého zvýšení spotřeby. Základní (už nic neříkající) TDP u nejvyššího modelu i9-13900K zůstalo 125 W, v boostu se zvýšilo na 253 W a po odemknutí power limitů může papkat až 350 W. Zajímavostí také je, že se po mnoha letech tomuto CPU podařilo pokořit absolutní rekord v přetaktování pod kapalným dusíkem, když ho overclocker Elmor vyhnal na 8812 MHz (předchozí rekord z roku 2014 byl 8722 MHz na AMD FX-8370).
      27.10.2022 Po zveřejnění výsledků intelu za Q3 2022 došlo v aftermarketu ke skokovému růstu akcií intelu o cca 6%, což se už dlouho nestalo. Že by se konečně pod vedením Pata Gelsingera začlo blýskat na lepší časy? Předchozí reporty byly obvykle následované poklesem podobné hodnoty. Nicméně za celý rok intel klesl skoro na polovinu a jeho podíl na trhu CPU se zmenšuje. Pamatuju pár let zpátky, kdy byl poměr cen akcií intel vs AMD opačný.
      30.7.2024 Tak koukám, že intelu už zas hnijou procesory, tentokrát jsou zřejmě postižené oxidací výkonnější modely 13. a 14. generace. Intel kolem problému napřed dost mlžil, nakonec přiznal problémy s výrobní technologií, ale prý se týká jen nepatrného % vyrobených CPU. Reklamace velkých prodejců ale hovoří o úplně jiných číslech. Intel vyřešil problém typicky po intelovsku vydáním patche mikrokódu, který zřejmě omezí výkon v turbo režimu a tím i sníží teploty a zpomalí proces degradace. A zákazník si mezitím koupí nový CPU Arrow Lake, který bude nejspíš vyrábět TSMC 3nm procesem místo zpožděného intel 20A. Následně ani hospodářské výsledky znovu nepotěšily: intel oznámil výsledky za 2Q a výhled pod odhady, pozastaví dividendu a propustí 15 tis. zaměstnanců, kurs akcií klesá na historické minimum za posledních 10 let 20,4$.
      2.12.2024 Intel dnes oznámil rezignaci CEO Pata Gelsingera, resp. jeho odchod do důchodu i ze správní rady. Jeho nástupce zatím není známý, intel dočasně povedou David Zinsner a Michelle Johnston Holthaus. Kurs akcií intelu na tuto zprávu překvapivě reagoval růstem o několik %. I přes snahu o rozběhnutí nových továren na křemík a masivním dotacím od americké vlády tržby a podíl na trhu intelu neustále klesá. Samozřejmě tyto investice se neprojeví hned. Uvidíme, jak intel uspěje s novým výrobním procesem 18A.

AMD Zen
      13.3.2017 AMD vrací úder, přichází Ryzen a někomu z toho možná praskne žilka :). Někdy v loni jsem zaznamenal mumlání o nové architektuře Zen, že to prý bude něco zcela nového a úžasného, ale moc jsem v to nevěřil a nevěnoval tomu více pozornost. Začátkem letošního roku už ale nešlo ten hype přehlédnout a začaly se objevovat různé leaknuté testy, podle kterých to opravdu vypadalo na revoluci. 2. března pak AMD oficiálně uvedlo do prodeje tři 8-jádrové top modely Ryzen 7 (1700 na 3,0 / 3,7 GHz, 1700X na 3,4 / 3,8 GHz a 1800X na 3,6 / 4,0 GHz) a objevily se též první recenze a testy.
      Oproti předchozím neúspěšným pokusům vzalo AMD návrh architektury Zen pěkně od podlahy a vytyčilo si smělý cíl překonat IPC předchozího Excavatoru alespoň o 40%. A výsledek předčil jejich vlastní očekávání, když dosáhli zrychlení až o 52%. Navíc díky konkurenceschopné 14nm výrobní technologii od GlobalFoundries se daří držet spotřebu na uzdě. Nejnižší model R7 1700 se dokonce vejde s TDP do 65 W.
      Základem Ryzenů je 4-jádrový modul CCX (CPU CompleX) se 4 x 64kB instrukční + 32kB datové L1 write-back cache, 4 x 512 KB L2 cache a 8 MB L3 cache, 2-kanálovým řadičem DDR4 2666 MHz efektivně a 24 linkami PCI-E 3.0. Každé jádro podporuje obdobu intelího Hyper-threadingu (zde zvaného SMT) a výčet instrukčních sad je podobný jako u intelu. 8-jádrové procesory obsahují 2 CCX moduly propojené rychlou sběrnicí Infinity Fabric, avšak navenek nabízí stále jen 2-kanálový řadič pamětí a 24 PCI-E linek. U serverových procesorů EPYC (Naples) s až 32 jádry bude k dispozici až 64 PCI-E linek a 8-kanálový paměťový řadič. Ryzen pokračuje dále v trendu integrace periferií směrem k SoC a oproti intelu v sobě navíc obsahuje řadič 4 x USB 3.1 gen 2, SATA3 a NVMe (SATA3 a NVMe využívají 4 PCI-E linky procesoru a umožňují kombinace x4 NVMe bez SATA3 nebo x2 NVMe + 2 x SATA3 nebo 2 x SATA3 + 2 x PCI-E). Tím se opět zjednodušuje design základních desek, kde lze použít minimalistické chipsety X300, A300, B300 (vhodné pro mini-ITX MB) propojené s procesorem pouze přes rychlou SPI sběrnici, čímž se ušetří 4 PCI-E linky procesoru, které jsou jinak potřeba pro komunikaci s klasickými desktopovými chipsety (low-end A320, mid-range B350, high-end X370). Všechny modely Ryzenu mají odemčený násobič a podporu XFR (eXtended Frequency Range), která může přidat až 50 resp. 100 MHz (X-kové verze) navíc po 25MHz krocích, pokud je čip dobře chlazen. Nepřekvapivě si nový Ryzen vyžádal nový socket AM4, ale AMD slibuje, že zas na nějakou dobu vydrží.
      Nové procesory Ryzen 7 jsou už běžně k dostání v našich obchodech a cena se pohybuje cca od 9800 Kč za model 1700 do 15000 Kč za top model 1800X. 4 a 6-jádrové Ryzeny 5 s 8 a 16MB cache o max. frekvenci 4 GHz budou brzy následovat a cenu bych tipoval tak od 5000 Kč. UPDATE: už byly vydány 4 modely Ryzen 5 a jsou ke koupi od 5200 do 7600 Kč. Nakonec přijdou 4-jádrové Ryzeny 3 bez SMT s 8MB cache. A jak dopadlo srovnání výkonu? Inu, v masivně multi-thred aplikacích uspěl Ryzen velmi dobře, dokonce třeba v testu video enkodéru HandBrake dosáhl R7 1800X více FPS než 10-jádrový intel Core i7-6950X s HT za cca 40000 Kč. Naopak v 1-vláknových testech (PiFast) byl Ryzen pomalejší, např. proti Core i7-6900K o 14% a proti nejrychleji taktovanému Core i7-7700K na 4,5 GHz o 41%. To se též promítlo do herních testů, kde na tom byl R7 1800X někdy hůře, než 4-jádro Core i5-7600K bez HT na na 4,2 GHz. Možnosti přetaktování na vzduchu nejsou moc velké, někomu se povedlo dosáhnout 4,3 GHz @1,45 V. S pomocí kapalného dusíku se podařilo zatím dosáhnout 5,8 GHz. Spotřeba je zhruba srovnatelná s podobnými procesory intelu a teploty na základních taktech vesměs i nižší. Na tomto videu je názorně vidět, že čip je k IHS poctivě připájený.
      Za zmínku také stojí, že CPU od AMD jsou běžně vybaveny paměťovým řadičem s podporou ECC pamětí, zatím co intel tuto funkci považuje za prémiovou jen pro dražší serverové CPU řady Xeon. Avšak sehnat základní desku, která má podporu ECC dotaženou i v BIOSu, je trochu problém. Jednou z mála je ASRock X370 Taichi, kde se podařilo ověřit funkci ECC pod Linuxem.
      I když Ryzen není absolutním vítězem, důležitým ukazatelem je poměr cena/výkon, který je u Ryzenu výrazně lepší. Takže konkurence je zpět a intel bude muset zlevňovat, (nejen) proto AMD fandím. Osobě kdybych teď pro sebe kupoval nový CPU, zůstal bych u intelu a šel do nejrychlejšího 4-jádra Core i7-7700K, protože mi dost záleží na single-thread výkonu. Ale myslím, že mi moje Sandy Bridge Core i7-2600K, kterému můžu v klidu taktnout jedno jádro na 5,1 GHz, ještě nějaký ten rok vydrží. Nemyslím si, že by brzo přišla nějaká lepší technologie, která by umožnila zásadně zvýšit frekvenci nebo IPC na jádro. Zde přidávám odkaz na praktické postřehy a testy Ryzenu 1700 kolegy Zenitha.
      4.7.2017 AMD vydalo řadu procesorů Ryzen Pro. Oproti základní řadě mají navíc podporu hardwarového šifrování RAM (pomocí 128-bitového AES), které funguje nezávisle na OS a dále delší záruku a delší zaručenou dostupnost. Na druhou stranu mají bohužel nižší taktovací frekvence, které dosahují max. 3,8 / 3,4 GHz při TDP 95 W. Dlouho po oficiálním vydání nebylo možné pro koncového zákazníka tyto procesory nikde koupit, až začátkem roku 2018 se objevilo v nabídce Suntechu 5 modelů Ryzeny Pro 1300, 1500, 1600, 1700 a 1700X za celkem rozumné ceny od 4693 do 9880 Kč (doba dodání je prý asi 2 týdny, UPDATE: Suntech nekonec nebyl schopen Ryzen Pro dodat a kolega ho sehnal jako podpultovku jinde).
      27.7.2017 AMD vydalo nejnižší řadu procesorů Ryzen 3, konkrétně 2 modely: R3 1200 s takty 3,1 / 3,4 GHz za 3000 Kč a R3 1300X s takty 3,5 / 3,7 GHz za 3500 Kč, oba s 8 MB L3 cache a TDP 65 W. R3 1300X se dá s trochou štěstí díky XFR popohnat v turbu až na 3,9 GHz. Ryzeny 3 vznikly jako nevyhnutelný odpad výroby vyšších modelů R5 a R7, obsahují tedy stejné 2 CCX moduly, kde jsou některá jádra deaktivována, stejně tak je vypnuto SMT. Do kancelářských low-end PC mají tyto procesory nevýhodu v absenci integrovaného GPU. Naopak do high-end PC míří chystaný ThreadRipper, který má jít do prodeje 10.8.2017. Nabídne 16 jader / 32 vláken, takty 3,4 / 4,0 GHz, 32 MB L3 cache, 4-kanálový řadič DDR4 a 64 PCI-E linek při TDP kolem 180 W za cenu cca 1000 $. Celkem nepřekvapivě bude používat nový socket TR4, který je výrazně větší než AM4 a prakticky shodný se socketem SP3 pro serverové procesory EPYC. Jeho vnitřnosti po odvíčkování si můžete prohlédnout zde (2 ze 4 křemíkových čipů jsou nezapojené a patrně vadné jen pro lepší držení IHS) a rentgenové snímky ThreadRipperu a EPYCu zde. Později overclocker der8auer experimentem zjistil, že ve stejném socketu TR4 je možné částečně rozběhnout i serverový procesor EPYC a to sice přelepením jedné plošky LGA pouzdra. Inicializace však záhy selhala POST kódem D0h při inicializaci paměťového subsystému, patrně proto, že EPYC používá 8-kanálový řadič a ThreadRipper jenom 4-kanálový. Možná po úpravě BIOSu (min. výměně modulu pro inicializaci paměťového řadiče) by si to dalo říct.
      7.8.2017 Jak už to tak bývá, žádná nová CPU architektura se neobejde bez chyb a AMD Ryzen není výjimkou. Po odhalení a opravě chyby instrukce FMA3 tu máme další problém, který se objevil ve FreeBSD při plném vytížení procesoru. AMD problém řeší, zatím jako workaround by mělo pomoci vypnout SMT. Začátkem roku 2018 také AMD vydalo aktualizace mikrokódů pro CPU Ryzen a EPYC opravujících zranitelnost Spectre. Další problém je chyba v implementaci VME, což způsobovalo pád 32-bitových OS při virtualizaci a AMD se to podařilo opravit až vydáním druhé generace Ryzen 2.
      23.1.2018 V 2. čtvrtletí roku 2018 chystá AMD vydání druhé generace procesorů Ryzen postavených na vylepšeném 12nm výrobním procesu Zen+. Už se objevily specifikace nového Ryzen 5 2600, kde při zachování TDP vzrostla turbo frekvence z 3,6 na 3,8 GHz, čili žádný zázračný růst přes 4 GHz se zatím nekoná. Také bude aktualizovaná řada ThreadRipperů, která má nabídnout až 32 jader a max. turbo frekvenci 4,4 GHz.
      20.3.2018 Izraelská bezpečnostní firma CTS Labs odhalila 4 typy zranitelností na nových procesorech a chipsetech AMD. Tři z nich (Masterkey, Ryzenfall a Fallout) se týkají PSP (Platform Security Processor - obdoba intel ME) integrovaného v procesorech Ryzen a EPYC a jedna (Chimera) pak embedded procesoru v chipsetu Promontory, který pro AMD vyvinula firma ASMedia. Více podrobností v tomto videu. Nebylo prokázáno, že by bylo možné tyto zranitelnosti exploitovat vzdáleně, je pro to potřebný lokální root přístup. Je trochu nestandardní, že CTS Labs vyrozuměla AMD o problému pouhých 24 hodin před zveřejněním. AMD předpokládá, že se dané zranitelnosti podaří vyřešit softwarově aktualizacemi firmware.
      10.4.2018 AMD vydává záplatu na zranitelnost Spectre, která vyžaduje jak aktualizaci OS (Windows / Linux), tak aktualizaci mikrokódu, jenž je k dispozici i na starší procesory až po generaci Bulldozer z roku 2011.
      17.9.2019 AMD se daří skvěle, do prodeje šla už 3. generace procesorů Ryzen vyráběná 7nm procesem u TSMC. Opět se zvýšily max. frekvence (až 4,7 GHz v boostu) i IPC (akorát je mi záhadou stále přetrvávající výrazně nižší výkon v DosBoxu proti intelu) a přibyl nový top model Ryzen 9 3950X s 16 jádry / 32 vlákny, 64 MB L3 cache a TDP 105 W, který se začne prodávat koncem září. Zůstává přitom zachována kompatabilita se staršími deskami se socketem AM4. Chystají se též nové Threadrippery s 32 až jádry, až 8-kanálovým řadičem pamětí DDR4 a 64 - 128 PCIe 4.0 linkami. Do serverů pak míří nejvýkonnější CPU EPYC Milan, který v 1 pouzdru může nést až 15 chipletů. Tato koncepce AMD se proti velkým monolitickým jádrům intelu zřejmě vyplácí lepší výtěžností a škálovatelností. AMD nezahálí a usilovně pracuje na vývoji nových architektur Zen 4 a Zen 5. Intelu pomalu začíná téct voda do prdele, jeho dlouho vyvíjený 10nm proces funguje dobře jen na nižších frekvencích a tak z posledních sil ždíme 14nm proces, kde se mu ještě daří dosahovat o něco vyšších frekvencí: 8-jádrové Core i9 9900K turbí na 5 GHz, ale nemůže konkurovat počtem jader a intel musel snížit ceny. K tomu se stále objevují nové bezpečnostní chyby, jejichž záplaty snižují výkon. Intel už pocítil propad prodeje a místo revoluční technologie startuje agresivní marketing, který např. začal vtipně zpochybňovat benchmark Cinebench.
      8.10.2020 AMD oficiálně představila novou generaci procesorů Ryzen 5xxx (Zen 3) pro socket AM4, vyráběnou vylepšeným 7nm procesem u TSMC. Nejvýkonnější desktopový model Ryzen 9 5950X nabídne standardně 16 jader / 32 vláken a 64 MB L3 cache za předpokládanou cenu 799$. Max. turbo frekvence se zvýšila na 4,9 GHz při zachování TDP 105 W, standardní jsou rozhraní PCIe 4.0 a DDR4. Jednojádrový výkon (IPC) poskočil o úctyhodných až 26% vůči předchozí generaci Zen 2 a v některých testech tak hravě překonává intel Core i9-10900K na 5,3 GHz, bravo AMD! V GeekBench 5 překonává o trochu i intel Core i7-1185G7. Další test PassMarku ukazuje rozdíl single-thread výkonu o 19% ve prospěch Ryzen 5 5600X proti Core i5-10600K (rozdíl v IPC 24,6%). Jen jestli se také zlepšil i výkon v DosBoxu :) U nás by dle Alzy měly být nové modely dostupné od 5.11. Budou fungovat v deskách s novými chipsety 5xx a začátkem příštího roku by měla být přidána podpora i pro starší desky s 4xx chipsety. Vzhledem k omezené kapacitě FlashROM pro BIOS tak budou nové beta BIOSy podporovat pouze nové CPU (podpora starších Ryzenů bude odstraněna). Uživatelé tak budou muset provést flashnutí se svým starým CPU a až pak jej vyměnit za nový CPU. BTW 27.10. AMD koupilo výrobce FPGA Xilinx za 35 mld $ (z větší části výměnou za vlastní akce), tak se možná třeba v příštích AMD CPU či GPU dočkáme nějakého bloku univerzální prog. logiky. Akcie konkurenčního intelu po výsledcích Q3 opět spadly o nějakých 16% dolů (předražené Xeony se nějak moc neprodávaly), AMD po solidních výsledcích a akvizici koriguje o -4%. Na podzim 2021 AMD získala 25% trhu x86 CPU. Cena akcií AMD se za letosšní rok skoro zdvojnásobila na 140$, zatím co intel stagnuje kolem 50$.
      27.9.2022 AMD oficiálně představila novou generaci procesorů Ryzen 7xxx (Zen 4) vyráběnou 5/6nm FinFET procesem u TSMC. Po dlouhé době dochází k zásadní změně pouzdra na beznožičkové LGA 1718 a nová patice nese název AM5. Nejvýkonnější desktopový model Ryzen 9 7950X nabízí stejně jako dříve 16 jader / 32 vláken a 64 MB L3 cache, L2 cache se zdvojnásobila na 16 MB a předpokládaná cena je 699$. Max. turbo frekvence se zvýšila na 5,7 / 4,5 GHz při nárůstu TDP na 170 / 230 W. 2-kanálový paměťový řadič podporuje DDR5 3600 - 5200 MHz (nikoliv už DDR4 jako intel) a pro připojení periferií je k dispozici 24 + 4 (pro chipset) linek PCIe 5.0. Obsahuje též integrované grafické jádro RDNA 2 (na 6nm I/O chipletu). Předpokládaný nárůst singlethread IPC je asi 13% proti Zen 3.
      6.8.2024 AMD za týden vydá novou generaci procesorů Ryzen 9xxx (Zen 5) pro stávající socket AM5 vyráběnou 4/6nm FinFET procesem u TSMC. Nejvýkonnější desktopový model Ryzen 9 9950X nabízí stejně jako dříve 16 jader / 32 vláken. Zůstává stejná i velikost L3 cache 64 MB a L2 cache 16 MB, zvýšila se však velikost datové L1 cache z 32 na 48 kB (instrukční zůstává 32 kB). Stejná je i max. turbo frekvence 5,7 / 4,3 GHz při stejném TDP 170 W. 2-kanálový paměťový řadič podporuje DDR5 až 5600 MHz a zvýšila se frekvence interní sběrnice Infinity Fabric na 2,4 GHz. Počet PCIe 5.0 linek zůstává 24 + 4. Byla rozšířena NPU jednotka pro akceleraci AI. Z prvních testů je zde však docela výrazný nárůst singlethread IPC kolem 17% proti předchozí generaci Zen i proti novému intel Core i9 14. generace.

Alternativní výrobci x86
      17.4.2018 Kdysi býval procesorový svět x86 mnohem pestřejší než dnes nudný, dosti asymetrický, duopol intel - AMD. Kdo si dnes vzpomene na x86 procesory značek NEC, SONY, Fujitsu, Siemens, Harris, OKI, Texas Instruments, Cyrix, UMC, ST, NexGen, IBM, IDT, Rise, Transmeta... První generace procesorů x86 byly oproti těm dnešním nepoměrně jednodušší, takže bylo možné zjistit jejich funkci reverzním inženýrstvím a kde kdo tak mohl vyrábět svoje klony. Později, jak rostla složitost, tak prostí replikátoři odpadli a udrželi se jen ti s vlastním návrhem x86 jádra. Zajímavý přístup zvolila firma Transmeta, jejíž procesory Crusoe obsahovaly dynamický translátor x86 instrukcí CMS na proprietární VLIW instrukce.
      Nejdále to dotáhla tchajwanská firma VIA, od procesorů C3 pro Socket 370 po 4-jádrové procesory Nano vyráběné 40nm technologií pro embedded segment. Po letech stagnace nyní VIA chytá druhý dech a po spojení s čínskou firmou Zhaoxin vydává novou generaci 4 a 8 jádrových procesorů řady KX vyráběných 28nm technologií s výhledem na 16 nm. Zásadním vylepšením je integrace paměťového řadiče DDR4 a podpora PCI-E 3.0, USB 3.1, SATA 3. Frekvence je ale jen 2 GHz, na 16 nm by mohlo být dosaženo 3 GHz. Zatím mají být tyto procesory vyráběny pro potřeby čínského trhu. UPDATE: intel kupuje od VIA část divize vývoje x86 CPU (Centaur Technology).
      8.10.2024 Po delší době se zas objevil nový model 8-jádrového (bez HT) CPU Zhaoxin KX-7000 vyráběného 7nm technologií, sestaveného z chipletů. Původ má zřejmě v bývalé architektuře Centaur CNS. Dosahuje max. turbo frekvence 3,7 / 3,2 GHz, podporuje paměti DDR4 a DDR5, 24 linek PCIe 4.0 a obsahuje 4 MB L2, 32 MB L3 cache. Používá stejnou patici LGA1700 jako intel, zřejmě kvůli kompatabilitě s existujícími chladiči, ale není elektricky kompatabilní. Používá nějaký vlastní chipset. Výkonově je někde na úrovni první generace AMD Zen či intel Skylake avšak při podstatně vyšší spotřebě. Proti předchozí generaci KX-6000 by měl být asi 2x rychlejší. Nenašel jsem zatím žádné základní desky pro tento CPU, kromě jedné stručné zmínky o desce od Asusu, která umožňuje přetaktování.
      Rusko už poměrně dlouho vyvíjí vlastní VLIW procesory Elbrus, které implementují dynamický překlad x86 instrukcí podobně jako Transmeta. Poslední model Elbrus-8S obsahuje 8 jader, běží na 1,3 GHz a vyrábí ho TSMC 28nm technologií. Integruje 4-kanálový paměťový řadič DDR3 s ECC a 16 MB L3 cache. Už se také objevily první PC osazené s tímto procesorem, na kterých běží Linux-based systém Elbrus OS. Žádný aktuální benchmark jsem nenašel, jen že starší 4-jádrový procesor Elbrus-4S na 800 MHz by měl být v x86 zhruba na úrovni Pentia-M či Atomů.
      Nakonec ještě zmíním tchajwanskou firmu DMP Electronics, která vyrábí SoC procesory Vortex86 pro embedded segment. Jsou to takové low-power 486-tky / Pentia na steroidech běžící až na 1 GHz s integrovaným paměťovým řadičem DDR3 a řadou periferií. Nepodporují instrukci CMOV, takže na nich neběží běžně kompilovaný kód pro 686. S těmito procesory se vyrábí řada roztomilých malých základních desek až po miniaturní 86Duino kompatabilní s Arduinem.

Zpět

Aktualizováno 3.12.2024 v 5:51