Zamyšlení (nejen) nad procesory intel

      13.2.2002 Dříve jsem na procesory intelu nenechal dopustit. A to z několika dobrých důvodů. Člověk (za sice poněkud vyšší cenu) dostal kvalitní procesor s rychlým koprocesorem, který šel výborně přetaktovat a přitom produkoval méně tepla než konkurence. Navíc pro intely byl dostatek kvalitních motherboardů (např. s legendárním chipsetem 440BX) s bezproblémovým chodem AGP a dostatkem slotů ISA.
      Časy se však mění a intel nám trochu usnul na vavřínech, díky čemuž největší konkurent AMD dosáhl doposud největšího významu. Nedávno mě překvapil článek o low-end procesoru VIA C3. Jeho výkon je bohužel degradován hrozně pomalým FPU avšak datová propustnost by díky 133MHz FSB nemusela být vůbec špatná. K dobru mu můžeme také připočíst instrukční sadu 3DNow! a kompatabilitu se Socket 370. Zato se však může chlubit 0,13µm technologií, díky čemuž si vystačí s pasivním chladičem (ztrátový výkon 733MHz CPU je 6 - 10 W). Navíc má procesor dokonce softwarově nastavitelný takt a tak lze ještě spotřebu snížit. To bych od VIA nečekal.
      A zatím intel lpí na své už zastaralé 0,18µm technologii a problémy s nadměrným teplem (u Pentia 4 až 50 W) řeší zavedením nového standardu ATX 2.0 a tak si patrně budeme muset koupit nové kastle.
      Právě uváděním stále nových a přitom nekompatabilních standardů mě intel velice popouzí. Stačí se podívat na vývoj patic procesorů. Socket 7 sloužil už dost dlouho klasickým pentiím (AMD ho ještě drželo pár let při životě procesory K6-II a K6-III) a tak pro novou generaci procesorů byla potřeba nová patice.
      Intel tedy vyvinul dosti odlišný Slot 1 pro Pentium II, které mělo externí L2 cache mimo čip CPU. Za chvíli zjistil, že výroba těchto procesorů je moc drahá a vrátil se ke klasické patici v podobě Socket 370. Zpočátku vyráběl procesory PPGA a poté sice se stejnou paticí avšak nekompatabilní procesory FC-PGA. Tím si přišli na své i výrobci redukcí. Redukce pro Slot 1 jsou celkem rozšířené, hroší je to však s redukcí PPGA:FC-PGA. Navíc nově plánované Pentium III s jádrem Tualatin (0,13 µm) bude vyžadovat opět nový Socket FC-PGA II a napěťový regulátor VRM s krokem 25 mV. Ani ti, co vsadili rovnou na Pentium 4 nebudou mít pokoje, protože součastné P4-Willamette pro Socket 423 bude nahrazeno novým P4-Northwood pro Socket 478 vyžadujícím i nový chipset. Myslím, že spíše než krátkozrakost intelu, je to jeho způsob, jak z lidí neustále tahat peníze...
      Konkurence AMD je v tomto ohledu mnohem věrnější svým standardům a vystačí si se starším Slotem A a součastným Socketem A. Procesory AMD jsou na stejných frekvencích už dokonce rychlejší než intely, včetně FPU (a to při znatelně nižší ceně). Přetaktovatelnost není sice tak dobrá, ale díky možnosti jednoduše odemknout násobič (což se na intelech ještě nikomu nepovedlo) lze přetaktování lépe rozvrhnout mezi FSB a jádro. AMD také používá mnohem propustnější FSB 100 / 133 MHz DDR (200 / 266 MHz efektivně) ve spojení s levnějšími pamětmi DDR SDRAM oproti drahým Rambus RDRAM na které se zaměřuje intel. Tepelná ztráta procesorů AMD je o něco větší než u intelů. Nepočetná nabídka základních desek pro Socket A se přece jen rozšiřuje a najdou se i nějaké se slotem ISA (např. Abit KT7E). Využívají chipsety VIA, AMD a připravuje se nForce od nVidie. Jen by mě zajímalo, jak a nakolik bezproblémově implementují AGP (s AGP na chipsetu VIA pro intel CPU jsem si užil problémů dost).
      Prodej low-endových konkurenčních procesorů AMD stále roste a pokud nás běžné uživatele bude intel dále ignorovat, zbude mu za pár let jen část trhu s Xeony pro servery, což si zas myslím, že by byla škoda. A tak vážně uvažuji, že i přes svou důvěru v intel, při koupi příští základní desky a procesoru už možná budu intel outside...

      25.10.2006 Při rozmýšlení nad nadcházejícím upgradem svého PC jsem se po pár letech vrátil zpět k této úvaze. Vývoj situace v oblasti procesorů mě nijak příliš nepřekvapoval. Intel zatloukl poslední hřebík do rakve Socketu 370 procesorem Celeron/Pentium III Tualatin, což byl na delší dobu poslední kvalitní CPU, který intel vyrobil. Očekávaný nárůst výkonu u Pentia 4 nebyl tak velký, jak se čekalo. Celeron Tualatin přetaktovaný na stejnou frekvenci jako P4 byl v řadě programů rychlejší než jeho nástupce. Asi taky proto se intel snažil tento debakl zamaskovat rychlým ukončením Tualatinu a masivní mediální kampaní propagující P4.
      Intel naháněl výkon zejména zvyšováním frekvence (až někam do 3,8 GHz), což ale šlo ruku v ruce s růstem spotřeby a problematickou uchladitelností jádra. Tehdá jsem si stěžoval, že 50 W je hodně a přitom Pentiu 4 D se podařilo překonat hranici TDP 100 W. Konkurent AMD mezitím neustále nabíral na síle a dokazoval, že umí podat stejný výkon při znatelně nižší frekvenci díky lepší architektuře. Ale čísla GHz se prodávají líp, i když i řada běžných uživatelů už tenhle trik prokoukla. Intel také za tu dobu stihl 2x změnit Socket z původního 423 přes 478 po LGA 775. Já jsem se rozhodl celou generaci P4 (NetBurst) ignorovat a provedl jsem pouze menší upgrade z Celeronu Coppermine na Celeron Tualatin 1100@1466 MHz, který mi necelé 2 roky dobře sloužil v MB Abit BX133-Raid.
      Když už jsem nad intelem pomalu lámal hůl, objevil se nový procesor Pentium M určený zejména pro notebooky (Socket 479), spolu s novým chipsetem známý jako platforma Centrino. Tento CPU od návrhářů izraelské divize intelu dosahuje na stejné frekvenci oproti P4 znatelně většího výkonu a to při menší spotřebě energie. Nejedná se přitom o kdovíjakou novinku, vzniklo totiž vylepšením jádra starého dobrého Pentia III, kterému se přidala veliká L2 cache, propustnější QDR sběrnice a výroba probíhala 130, 90 a 65nm technologií. Bohužel na desktopy se Pentium M moc nerozšířilo (intel dobře věděl, že si to vzhledem k P4 nemůže dovolit), neb základních desek je dosti po málu (asi s jediným chipsetem i855). Také se objevila redukce do Socketu 478. U nás však ne moc dostupná a předražená (jak jinak), která ale vyžadovala podporu BIOSu, jež mnoho desek nemělo.
      Doufal jsem, že intel časem pochopí, že s P4 šlápl vedle a bude dále rozvíjet Pentium-M. A tak jsem se také dočkal (zřejmě díky tomu, že intel narazil na frekvenční strop současné křemíkové technologie :). Izraelci se činili a přišli s novými procesory Core Duo a Core Solo pro notebooky (kódové jméno Yonah, Socket 479) a konečně Core 2 Duo (Conroe / Allendale, Socket LGA 775) pro desktopy a notebooky (Merom, Socket 479). Dochází také k rozmachu multiprocesingu. 2 jádra už nabízelo Pentium 4 D, ale v případě Core 2 Duo ani není dostupná jednojádrová verze a co nevidět tu bude čtyřjádrová. Otázka je, kolik současných programů to plně využije. Předpokládám však, že masivní rozšíření více jader donutí programátory nad tím zapřemýšlet.
      V současnosti jsou pro desktopy dostupné procesory Core 2 Duo E6300, E6400, E6600 a E6700 pracující na frekvencích 1,86, 2,13, 2,40 a 2,67 GHz. Na první pohled jsou to čísla menší, výkonově si ale E6700 poradí s Pentiem 4 D na 3,6 GHz i Athlonem 64 FX-60 na 2,6 GHz. Max. ztrátový výkon se pohybuje kolem přijatelných 65 W díky 65nm technologii (to dává také velký potenciál přetaktování). EIST (Enhanced Intel SpeedStep) umožňuje dynamicky za chodu měnit frekvenci (snížením násobiče) a napětí jádra. Core 2 Duo je vybaveno 2x 32 kB L1 cache a 2 nebo 4 MB sdílené L2 cache. Díky tomu si jádra mohou rychleji vyměňovat data, aniž by se tím zatěžovala pomalá FSB. V případě, že se využívá jen jedno jádro, je mu celá L2 cache k dispozici a tak ani část nezahálí. Instrukční sada byla rozšířena o SSE4 a 64-bitové rozšíření EM64T (Extended Memory 64 Technology) převzaté od AMD. Sběrnice FSB běží na 266 MHz QDR (1066 MHz efektivně), což spolu s velkou a rychlou cache zvětšuje propustnost paměťového subsystému. Nové intelí chipsety navíc mají 2-kanálový řadič paměti, který při použití 2 stejných SDRAM modulů přidá dalších pár desítek %.
      Zmínil jsem, že procesor Core 2 Duo je určen pro Socket LGA 775 (stejně jako nová Pentia 4), ale nebyl by to intel, kdyby s uživateli stávajících desek řádně nevyjebal. Ano historie se opakuje. Intel trochu pozměnil pár pinů a specifikaci napájení, díky čemuž se C2D v těchto deskách vůbec nerozjede a uživatel má prostě smolíka. Není to ani problém chipsetu, jak se můžeme někde mylně dočíst, jen je potřeba implementovat novou specifikaci napěťového regulátoru VRM. Možná že by to ale šlo i jinak? Výrobci postupně vydávají nové revize svých desek s podporou C2D i zcela nové desky, nejčastěji s PCI-E chipsety i945, i975 a i965 (kde se vyskytly nějaké chybky a čeká se na další stepping).
      Celkově se tedy procesor Core 2 Duo velmi vydařil a to mě inspirovalo k dlouho odkládanému kompletnímu upgradu. Léta jsem váhal, ale nijak toho nelituju, že jsem P4 úplně vynechal. Přechod k AMD se tedy nekoná :). Nakonec jsem se podle ceny rozhodl pro C2D E6400 na 2,13 GHz s 2 MB L2 cache, což je můj už šestý procesor od intelu, pro nějž jsem vybral základní desku Asus P5LD2 s chipsetem intel 945P + ICH7R. Po roce a půl jsem základní desku vyměnil za Gigabyte GA-P31-DS3L s chipsetem intel P31, který podporuje novější 45nm C2D procesory, z nichž jsem si vybral rychlé dvoujádro E8500 na 3,16 GHz s 6 MB L2 cache, později nahrazené nejvyšším modelem E8600 na 3,33 GHz.

      7.10.2015 Intel z úspěchu procesorů Core 2 Duo a Core 2 Quad těžil po mnoho let a velmi se mu dařilo. Koncem roku 2008 pak vydal další generaci procesorů Core i5 a i7 založených na nové revoluční architektuře Nehalem. Její hlavní novinky jsou integrace 2 - 3 kanálového paměťového řadiče DDR3 SDRAM (AMD už integrovalo paměťový řadič do svého Opteronu o mnoho let dříve a po vyladění počátečních potíží se to ukázala být ta správná cesta) a změna architektury cache na tříúrovňovou, což zhruba zdvojnásobilo paměťovou propustnost proti C2D. Tím se výrazně zjednodušil design základních desek, kde zmizel severní můstek MCH (Memory Controller Hub) a jižní můstek ICH (I/O Controller Hub) se změnil na PCH (Platform_Controller_Hub) s kterým procesor komunikuje přes QPI (QuickPath Interconnect). Novější rodina procesorů Lynnfield do sebe navíc integruje 16-linkový PCI-E 2.0 řadič. Na komunikaci s PCH tak stačí pomalejší sběrnice DMI (Direct Media Interface). Typická konfigurace Core i7 pro desktopy má 4 jádra (navíc se zpět do hry vrací Hyper-threading) s 8 MB sdílené L3 chache, kde každé jádro má dále k dispozici dedikovanou 64 kB L1 cache a 256 kB L2 cache. Přibyly též nové instrukce SSE4.2 a HW podpora virtualizace VT-x. Samozřejmě nechybí (tentokrát celkem oprávněně) nový socket a to hned ve 3 variantách: LGA 1156 pro desktopy, LGA 1366 pro výkonné pracovní stanice a servery a LGA 1567 pro high-end servery. Výrobní proces zůstává na 45 nm, což poněkud limituje frekvenční růst na max. 3,33 GHz.
      Je též zajímavé, jak intel změnil svůj postoj k přetaktování. Od nekompromisního uzamčení násobiče směrem nahoru přešel k technologii Turbo Boost, která je defakto mírným přetaktováním v mezích zákona (rozuměj limitu TDP). V případě potřeby (skrze požadavek OS) se tak dynamicky zvedne násobič a Vcore. Dosažená turbo frekvence závisí na počtu aktivních jader (maximální turbo frekvence dosáhne jen jedno jádro) a na odebíraném proudu, příkonu a teplotě. Jelikož z této architektury zmizela FSB, je zde frekvence jádra odvozena od base clock 133 MHz. Z ní se odvozuje též frekvence PCI-E a dalších kritických periferií, takže s ní nejde moc hýbat. Pokud to základní deska umožňuje, lze base clock zvýšit jen o pár MHz.
      Později v roce 2010 došlo ke zmenšení výrobní technologie na 32 nm pod označením Westmere. Max. frekvence se tak posunula na 3,86 GHz (u některých vzorků Xeonů až 4,4 GHz). Do rodiny Core i5 a i7 přibyl ještě očesaný 2-jádrový procesor i3. Instrukční sada byla rozšířena o podporu AES Zásadní novinkou byla integrace grafického jádra do některých procesorů (mobilní rodiny Arrandale a desktopové rodiny Clarkdale), které využívá sdílené operační paměti i výhody L3 cache. Jedná se o multičipové procesory, kde CPU bylo vyráběno novější 32nm technologií zatímco GPU starší 45nm technologií.
      Začátkem roku 2011 vydal intel novou architekturu Core 2. generace s názvem Sandy Bridge. Nejedná se už o žádnou velkou revoluci, ale spíše drobnější vylepšení předchozí architektury. Kromě optimalizací výpočetních jader přibyla nová 256-bitová instrukční sada AVX (Advanced Vector Extensions) a bezpečnostní technologie TXT (Trusted Execution Technology) spolupracující s TPM (Trusted Platform Module). Nejvíce změn prodělalo grafické jádro HD Graphics s podporou kodeku H.264, které se stalo u některých procesorů nedílnou součástí čipu. Výrobní technologie zůstává na 32 nm a nejvyšší modely dosahují turbo frekvence 4,0 GHz. 4-jádrová varianta s 8 MB L3 cache obsahuje více než 1 miliardu tranzistorů. Nechybí též "oblíbená" změna socketu na LGA 1155 pro desktopy a LGA 2011 pro výkonné pracovní stanice a servery. Alespoň že intel myslel i na nadšence overclockery a vydal řadu procesorů 2xxxK s odemčeným násobičem (tzn. lze nastavit vyšší než jmenovitou turbo frekvenci a to pro každé jádro zvlášť bez ohledu na TDP), avšak za patřičně vyšší cenu. Při upgrade PC koncem roku 2015 jsem si jeden takový model Core i7-2600K pořídil z druhé ruky a myslím, že i dnes výkonově nijak moc nezaostává. S trochou přetaktování bez problému dožene i současné top modely Core i7.
      Po roce intel zmenšil výrobní technologii na 22 nm, která poprvé využívá 3D tri-gate tranzistory. 3. generace Core nese název Ivy Bridge a přináší pár dalších vylepšení jako třeba nový řadič PCI-E 3.0 a instrukci RdRand. Nejvyšší modely dosahují jen nepatrně vyšší turbo frekvence 4,1 GHz proti Sandy Bridge a taktéž nárůst výkonu CPU jen o pár %. Naopak u GPU je zrychlení znát. Zvýšil se počet EU, podpora DX11, OpenGL 4.0, OpenCL 1.1 a 4k videa, ale pořád je to někde jinde, než externí PCI-E VGA. Ale pro méně náročnější uživatele, zejména u notebooků to vystačí a ušetří baterie. Výkonnější notebooky integrují samostatný GPU čip od ATI/nVidie, na který lze dynamicky přepnout v případě spuštění nějaké náročnější 3D aplikace. Patice tentokrát zůstala stejná, takže s patřičnou podporou BIOSu mohou upgradovat i majitelé starších desek pro Sandy Bridge. Overclockeři ale z nových CPU nebyly moc nadšeni, protože při přetaktování velmi rychle rostla teplota jádra, bez ohledu na teplotu chladiče. Zjistilo se, že zde intel místo pájení IHS ke křemíkovému čipu použil nepříliš kvalitní teplovodivou pastu. Obnovila se tak stará známá praktika sundávání IHS z dob Pentia III Tualatin a s dobře nakontaktovaným chladičem s měděnou základnou bylo možno výrazně snížit teplotu jádra CPU. I po této úpravě nešlo přetaktování tak dobře, zřejmě kvůli větší hustotě integrace, větším leakage proudům a nutnosti více zvyšovat Vcore. Později jsem si přečetl zajímavý článek o pájení CPU jader, které není vůbec technologicky jednoduchý proces a zejména u menších jader přináší vážné komplikace s životností.
      Intel najel na pravidelný proces aktualizací svých CPU zvaný tik-tak. Tik znamená změnu technologie výroby (jemnější litografie), do které překlopí předchozí generaci s menšími vylepšeními. Tak zas znamená výraznější změnu samotné architektury vyrobené na odladěné technologii. V létě 2013 vydal novou architekturu Core 4. generace s názvem Haswell. Intel se tentokrát popral s velkou výzvou - podařilo se mu do procesoru integrovat napěťový regulátor FIVR (Fully Integrated Voltage Regulator), celá prezentace zde. Ten se sice neobejde bez dalšího předregulátoru na základní desce (pouštět do CPU rovnou 5 či 12 V by bylo na dané technologii nereálné), ale umožní tak procesoru lépe zvládat dynamické proudové špičky při změně zátěže, rychlejší přechody mezi úspornými a výkonovými stavy a jemnější změnu Vcore. FIVR se skládá celkem z 320 fází (včetně integrovaných planárních cívek), každá skupina po 16 fázích dodá proud až 25 A s spínací frekvence se pohybuje v rozsahu 30 - 140 MHz. To je řádově jinde, než běžný 4-fázový VRM s efektivní frekvencí 1 MHz. To se samozřejmě neobešlo bez změny patice na LGA 1150 pro desktopy a LGA 2011-v3 pro servery, je sice fyzicky stejná jako LGA 2011-v1, ale elektricky kompatabilní není. Dále přibyly nové instrukční sady AVX2, FMA3, TSX (avšak kvůli HW chybě nepoužitelné) a max. turbo frekvence byla zvýšena na 4,4 GHz. Nejvíce vylepšení bylo opět v GPU. Pro některé mobilní verze procesorů byla použita nová grafika Iris Pro 5200 se 128 MB eDRAM integrované přímo v BGA pouzdru (avšak jako samostatný kus křemíku vedle CPU). U novější řady procesorů Haswell Refresh z roku 2014 byla použita kvalitnější tepelná pasta mezi čipem a IHS.
      Dalším tikem byl přechod na 14nm litografii koncem roku 2014, kdy byla vydána 5. generace Core s názvem Broadwell. Změny architektury jsou spíše jen kosmetické. Vyjma prvních Broadwellů byla opravena chyba v implementaci TSX, přibyla nová instrukce RdSeed pro generování náhodných čísel z interního šumového generátoru a byla implementována nová bezpečnostní funkce SMAP, která by měla zabránit nechtěnému spuštění kódu z paměti uživatelského procesu v kernel módu (exploity k eskalaci oprávnění). To samozřejmě vyžaduje zapracovat podporu SMAP i do OS. Procesory s jádrem Broadwell byly cíleny zejména do mobilní sféry (pouzdra BGA) a do serverů (socket LGA 2011-v3). Pro desktopy (socket LGA 1150) byly určeny pouze 2 modely Core i5 a i7 s integrovanou grafikou Iris Pro 6200, která má k dispozici 128 MB eDRAM (stále 2 čipy v 1 pouzdře jako u Haswellu). Max. turbo frekvence dosahuje pouze 3,7 GHz u desktopových CPU a 4,0 GHz u serverových CPU, možnosti přetaktování jsou mizerné.
      Po odladění 14nm výrobního procesu uvedl intel koncem léta 2015 novou architekturu Core 6. generace s názvem Skylake, která přináší některé zásadní změny. Intel se rozhodl z blíže neurčeného důvodu odstranit z jádra procesoru svůj unikátní design integrovaného regulátoru FIVR, který u Haswellu tolik opěvoval. Možná to zhoršovalo výtěžnost výroby nebo se předpokládané výhody v reálu ukázaly býti menší a nevýhody větší, než se původně čekalo. To s sebou, jak je u intelu zvykem, neslo další změnu patice na LGA 1151 pro desktopy a pro servery se chystá během roku 2017 nový socket LGA 2066. Kapánek problémovou změnou se ukázalo ztenčení substrátové PCB procesoru, což vedlo v některých případech k nepříjemným deformacím vlivem přítlaku chladiče. Další zásadní změnu prodělal integrovaný paměťový řadič, který nyní podporuje paměti DDR4 a DDR3L, které pracují s nižším napájecím napětím (1,2 V resp. 1,35 V) o proti stávajícím DDR3 (1,5 V). Přestože intel DDR3 oficiálně nepodporuje (kvůli potenciální možnosti poškození CPU vyšším napětím na paměťové sběrnici), někteří výrobci MB přesto takové základní desky vyrobili. V současnosti už cena DDR4 pamětí klesla, takže nemá cenu to riskovat. Dále přibyla nové instrukční sada AVX-512 a bezpečnostní rozšíření MPX a SGX pro kontrolu mezí a lepší ochranu paměti uživatelských procesů. Konstantně se vylepšuje GPU - HD/Iris Graphics 5xx s podporou DX12, OpenGL 4.5, OpenCL 2.0, kodeků VP8, VP9 a H.265 a 128 MB eDRAM u některých modelů. Max. turbo frekvence se mírně zvýšila na 4,2 GHz (spolu s TDP), což stále nedosahuje taktů Haswellu ale i tak dosahuje průměrného nárůstu single-thread výkonu asi o 6%.
      Intel se opozdil s vývojem 10nm výrobního procesu a tak trochu naboural stávající zaběhnuté tik-tak schéma vydáním 7. generace Core s názvem Kaby Lake na odladěném 14nm procesu koncem léta 2016. Přináší pouze drobné změny a vylepšení, převážně v GPU části (podpora HDCP 2.2, HW kódování H.264 a H.265 v 10-bitové hloubce, které několikanásobně snižuje spotřebu procesoru při přehrávání videa oproti SW implementaci). Instrukční sada a patice LGA 1151 zůstala beze změn, pouze se zvýšila max. turbo frekvence na 4,5 GHz a rychlost přechodu z jedné frekvence na druhou. To mi přijde trochu málo. Předpokládá se, že i další generace Coffee Lake bude vyráběná též 14nm procesem a půjde o další recyklaci Skylake. Cannon Lake na 10 nm procesu bude nejspíš až v roce 2018.
      Intel u každé nové generace slibuje výrazný nárůst IPC, ale skutečnost v reálných aplikacích je jiná, single-thread výkon roste od dob Sandy Bridge jen velmi málo (při stejné frekvenci) a samotná max. frekvence se od dob Haswellu také zvýšila jen nepatrně. Na dlouhodobější srovnání výkonu různých generací Core se můžete podívat zde, zde a zde. Ceny intelích procesorů se přitom dlouhodobě drží na výši jako nikdy předtím, což je důsledek toho, že intelu chybí pořádná konkurence. Kvalita ceně bohužel občas moc neodpovídá, jak se ukázalo třeba v aféře umírajících serverových Atomů C2xxx těsně po záruce. Vývoj AMD jsem moc nesledoval, protože od dob Core 2 bylo neustále pozadu a nezměnily to ani všechny pokusy o vícejádrové procesory Bulldozer, Piledriver, Steamroller a Excavator dohnané do extrémních šíleností typu 8-jádrový 32nm přímotop AMD FX-9590 na 4,7 / 5,0 GHz s TDP 220 W. Nutno podotknout, že intel házel AMD dost nepěkně klacky pod nohy svými neférovými obchodními praktikami, za což byl posléze "odměněn" pokutou 1 mld euro, avšak to jsou pouhé 4% jeho obratu. AMD je proti intelu řádově menší firma, která nemá vlastní fabriky na výrobu křemíku, takže pro ně bylo dost těžké takovému Gigantovi konkurovat.
      7.8.2017 Tak to vypadá, že po vydání Zenu od AMD se konečně v intelu pohnuly ledy. Po letech stagnace tu najednou máme core i3 s odemčeným násobičem, chystá se nové 4-jádrové core i3 s HT, core i5 a i7 povýší na 6 jader, objevilo se nové core i9 (Skylake-X) pro high-end PC až s 18 jádry + HT a také ceny začaly pomalu klesat. Co víc si přát, až na tu tragickou (ne)kompatabilitu socketů a chipsetů (že by záměrně?)...
      4.1.2018 Začátkem nového roku byla zveřejněna docela závažná bezpečnostní díra v CPU bloku TLB cache, kdy uživatelský proces může vyčíst z cache nějaká data kernelu, která se tam dostala při spekulativním čtení, neboť procesor v tomto případě neřeší úrovně oprávnění (patrně kvůli rychlosti operace). Bylo prokázáno dokonce více typů těchto chyb a dostaly jména Meltdown a Spectre, viz Google Project Zero. Názorně to popisují tyto 2 příspěvky od xvaska a Jana Ringoše. Prý jsou postiženy všechny x86 CPU intelu od roku 1995, tj. architektura P6 vyjma některých starších in-order Atomů. Některé z chyb typu Spectre se týkají i AMD, IBM Power a novějších ARMů, nikoliv však třeba ARM Cortex-A7 a Cortex-A53 použitých v Raspberry Pi 2 a 3. Aktualizace info zde. Intel o chybě věděl už od loňského června (a prý o tom řekl dříve Číně než domácím USA), patrně se pokoušel vyřešit problém aktualizací mikrokódu, ale nepovedlo se a je nutný patch do jádra OS. Ten při přepínání kontextu invaliduje cache, čímž značně snižuje výkon CPU, cca o 5 - 30%. Patch pro Linux kernel je volitelný a pro Windows 10 / Server 2016 (pro starší Windows zatím nic) byla vydána záplata KB4056892, která však na některých PC s CPU AMD dojebe OS. Stav zranitelností vašeho systému si můžete ověřit tímto linuxovým skriptem nebo utilitou InSpectre pro Windows, exploity se už na Internetu pomalu rojí. BTW než se problém zveřejnil, stihl šéf intelu včas prodat většinu svých akcií, jejichž hodnota následně ze dne na den klesla asi o 7%.
      29.1.2018 Snaha intelu opravit chybu novým mikrokódem se zatím moc nedaří, uživatelé postupně hlásí různé nestability svých PC, které před updatem neměli. Měření poklesu výkonu různých CPU v různých aplikacích viz zde a zde. Je s podivem, že tak velká společnost nebyla schopná svou aktualizaci před vydáním řádně otestovat. Micro$oft i Red Hat nakonec problémové aktualizace stáhli a sám intel je už také nedoporučuje dále instalovat, ale už snad našli příčinu problému a pracují na dalším update. Na některé starší CPU se ale už záplaty dělat nebudou. Zevrubný popis chyb a současný stav oprav pěkně shrnuje přednáška Vojtěcha Pavlíka z letošního Installfestu. Dále intel oznámil, že prý ještě koncem letošního roku vydá hardwarově opravené procesory.
      28.3.2018 Byla publikována další zranitelnost CPU BranchScope, podobná předchozí Spectre 2, která využívá PHT (Pattern History Table) v prediktoru skoků. Zatím byla potvrzena na CPU intel řady Skylake, Haswell a Sandy Bridge. Podařilo se přečíst data z paměti chráněné SGX (Software Guard Extensions) a patrně obejít randomizaci paměti ASLR. Dále se ukázalo, že Micro$oft svou lednovou záplatou proti Meltdownu na Windows 7 64-bit vytvořil mnohem větší bezpečnostní díru, když změnou 1 bitu odemkl přístup k tabulce stránek jádra i pro uživatelské procesy, čímž umožnil ničím neomezené čtení i zápis celé paměti a to mnohem rychleji a pohodlněji než přes Meltdown. Testovací prográmek na tuto zranitelnost je zde. Micro$oft už na to vydal rychlou opravu KB4100480 opravy...
      20.11.2018 Objevených HW zranitelností v CPU neustále přibývá a máme tu další nazvanou PortSmash, která umožňuje na CPU se zapnutým HyperThreadingem číst jednomu procesu paměť druhého procesu na stejném fyzickém jádře. Využívá opět postranní kanál měření času vykonávaných instrukcí a z toho odvozuje vykonávané instrukce na sousedním virtuálním jádře. Chyba byla demonstrována přečtením SSL klíčů z procesu OpenSSL na CPU intel Skylake a Kaby Lake. Na AMD Ryzen zatím potvrzena nebyla.

AMD Zen

      13.3.2017 AMD vrací úder, přichází Ryzen a někomu z toho možná praskne žilka :). Někdy v loni jsem zaznamenal mumlání o nové architektuře Zen, že to prý bude něco zcela nového a úžasného, ale moc jsem v to nevěřil a nevěnoval tomu více pozornost. Začátkem letošního roku už ale nešlo ten hype přehlédnout a začaly se objevovat různé leaknuté testy, podle kterých to opravdu vypadalo na revoluci. 2. března pak AMD oficiálně uvedlo do prodeje tři 8-jádrové top modely Ryzen 7 (1700 na 3,0 / 3,7 GHz, 1700X na 3,4 / 3,8 GHz a 1800X na 3,6 / 4,0 GHz) a objevily se též první recenze a testy.
      Oproti předchozím neúspěšným pokusům vzalo AMD návrh architektury Zen pěkně od podlahy a vytyčilo si smělý cíl překonat IPC předchozího Excavatoru alespoň o 40%. A výsledek předčil jejich vlastní očekávání, když dosáhli zrychlení až o 52%. Navíc díky konkurenceschopné 14nm výrobní technologii od GlobalFoundries se daří držet spotřebu na uzdě. Nejnižší model R7 1700 se dokonce vejde s TDP do 65 W.
      Základem Ryzenů je 4-jádrový modul CCX (CPU CompleX) se 4 x 64kB instrukční + 32kB datové L1 write-back cache, 4 x 512 KB L2 cache a 8 MB L3 cache, 2-kanálovým řadičem DDR4 2666 MHz efektivně a 24 linkami PCI-E 3.0. Každé jádro podporuje obdobu intelího Hyper-threadingu (zde zvaného SMT) a výčet instrukčních sad je podobný jako u intelu. 8-jádrové procesory obsahují 2 CCX moduly propojené rychlou sběrnicí Infinity Fabric, avšak navenek nabízí stále jen 2-kanálový řadič pamětí a 24 PCI-E linek. U serverových procesorů EPYC (Naples) s až 32 jádry bude k dispozici až 64 PCI-E linek a 8-kanálový paměťový řadič. Ryzen pokračuje dále v trendu integrace periferií směrem k SoC a oproti intelu v sobě navíc obsahuje řadič 4 x USB 3.1 gen 2, SATA3 a NVMe (SATA3 a NVMe využívají 4 PCI-E linky procesoru a umožňují kombinace x4 NVMe bez SATA3 nebo x2 NVMe + 2 x SATA3 nebo 2 x SATA3 + 2 x PCI-E). Tím se opět zjednodušuje design základních desek, kde lze použít minimalistické chipsety X300, A300, B300 (vhodné pro mini-ITX MB) propojené s procesorem pouze přes rychlou SPI sběrnici, čímž se ušetří 4 PCI-E linky procesoru, které jsou jinak potřeba pro komunikaci s klasickými desktopovými chipsety (low-end A320, mid-range B350, high-end X370). Všechny modely Ryzenu mají odemčený násobič a podporu XFR (eXtended Frequency Range), která může přidat až 50 resp. 100 MHz (X-kové verze) navíc po 25MHz krocích, pokud je čip dobře chlazen. Nepřekvapivě si nový Ryzen vyžádal nový socket AM4, ale AMD slibuje, že zas na nějakou dobu vydrží.
      Nové procesory Ryzen 7 jsou už běžně k dostání v našich obchodech a cena se pohybuje cca od 9800 Kč za model 1700 do 15000 Kč za top model 1800X. 4 a 6-jádrové Ryzeny 5 s 8 a 16MB cache o max. frekvenci 4 GHz budou brzy následovat a cenu bych tipoval tak od 5000 Kč. UPDATE: už byly vydány 4 modely Ryzen 5 a jsou ke koupi od 5200 do 7600 Kč. Nakonec přijdou 4-jádrové Ryzeny 3 bez SMT s 8MB cache. A jak dopadlo srovnání výkonu? Inu, v masivně multi-thred aplikacích uspěl Ryzen velmi dobře, dokonce třeba v testu video enkodéru HandBrake dosáhl R7 1800X více FPS než 10-jádrový intel Core i7-6950X s HT za cca 40000 Kč. Naopak v 1-vláknových testech (PiFast) byl Ryzen pomalejší, např. proti Core i7-6900K o 14% a proti nejrychleji taktovanému Core i7-7700K na 4,5 GHz o 41%. To se též promítlo do herních testů, kde na tom byl R7 1800X někdy hůře, než 4-jádro Core i5-7600K bez HT na na 4,2 GHz. Možnosti přetaktování na vzduchu nejsou moc velké, někomu se povedlo dosáhnout 4,3 GHz @1,45 V. S pomocí kapalného dusíku se podařilo zatím dosáhnout 5,8 GHz. Spotřeba je zhruba srovnatelná s podobnými procesory intelu a teploty na základních taktech vesměs i nižší. Na tomto videu je názorně vidět, že čip je k IHS poctivě připájený.
      I když Ryzen není absolutním vítězem, důležitým ukazatelem je poměr cena/výkon, který je u Ryzenu výrazně lepší. Takže konkurence je zpět a intel bude muset zlevňovat, (nejen) proto AMD fandím. Osobě kdybych teď pro sebe kupoval nový CPU, zůstal bych u intelu a šel do nejrychlejšího 4-jádra Core i7-7700K, protože mi dost záleží na single-thread výkonu. Ale myslím, že mi moje Sandy Bridge Core i7-2600K, kterému můžu v klidu taktnout jedno jádro na 5,1 GHz, ještě nějaký ten rok vydrží. Nemyslím si, že by brzo přišla nějaká lepší technologie, která by umožnila zásadně zvýšit frekvenci nebo IPC na jádro. Zde přidávám odkaz na praktické postřehy a testy Ryzenu 1700 kolegy Zenitha.
      4.7.2017 AMD vydalo řadu procesorů Ryzen Pro. Oproti základní řadě mají navíc podporu hardwarového šifrování RAM (pomocí 128-bitového AES), které funguje nezávisle na OS a dále delší záruku a delší zaručenou dostupnost. Na druhou stranu mají bohužel nižší taktovací frekvence, které dosahují max. 3,8 / 3,4 GHz při TDP 95 W. Dlouho po oficiálním vydání nebylo možné pro koncového zákazníka tyto procesory nikde koupit, až začátkem roku 2018 se objevilo v nabídce Suntechu 5 modelů Ryzeny Pro 1300, 1500, 1600, 1700 a 1700X za celkem rozumné ceny od 4693 do 9880 Kč (doba dodání je prý asi 2 týdny).
      27.7.2017 AMD vydalo nejnižší řadu procesorů Ryzen 3, konkrétně 2 modely: R3 1200 s takty 3,1 / 3,4 GHz za 3000 Kč a R3 1300X s takty 3,5 / 3,7 GHz za 3500 Kč, oba s 8 MB L3 cache a TDP 65 W. R3 1300X se dá s trochou štěstí díky XFR popohnat v turbu až na 3,9 GHz. Ryzeny 3 vznikly jako nevyhnutelný odpad výroby vyšších modelů R5 a R7, obsahují tedy stejné 2 CCX moduly, kde jsou některá jádra deaktivována, stejně tak je vypnuto SMT. Do kancelářských low-end PC mají tyto procesory nevýhodu v absenci integrovaného GPU. Naopak do high-end PC míří chystaný ThreadRipper, který má jít do prodeje 10.8.2017. Nabídne 16 jader / 32 vláken, takty 3,4 / 4,0 GHz, 32 MB L3 cache, 4-kanálový řadič DDR4 a 64 PCI-E linek při TDP kolem 180 W za cenu cca 1000 $. Celkem nepřekvapivě bude používat nový socket TR4, který je výrazně větší než AM4 a prakticky shodný se socketem SP3 pro serverové procesory EPYC. Jeho vnitřnosti po odvíčkování si můžete prohlédnout zde (2 ze 4 křemíkových čipů jsou nezapojené a patrně vadné jen pro lepší držení IHS) a rentgenové snímky ThreadRipperu a EPYCu zde. Později overclocker der8auer experimentem zjistil, že ve stejném socketu TR4 je možné částečně rozběhnout i serverový procesor EPYC a to sice přelepením jedné plošky LGA pouzdra. Inicializace však záhy selhala POST kódem D0h při inicializaci paměťového subsystému, patrně proto, že EPYC používá 8-kanálový řadič a ThreadRipper jenom 4-kanálový. Možná po úpravě BIOSu (min. výměně modulu pro inicializaci paměťového řadiče) by si to dalo říct.
      7.8.2017 Jak už to tak bývá, žádná nová CPU architektura se neobejde bez chyb a AMD Ryzen není výjimkou. Po odhalení a opravě chyby instrukce FMA3 tu máme další problém, který se objevil ve FreeBSD při plném vytížení procesoru. AMD problém řeší, zatím jako workaround by mělo pomoci vypnout SMT. Začátkem roku 2018 také AMD vydalo aktualizace mikrokódů pro CPU Ryzen a EPYC opravujících zranitelnost Spectre.
      23.1.2018 V 2. čtvrtletí roku 2018 chystá AMD vydání druhé generace procesorů Ryzen postavených na vylepšeném 12nm výrobním procesu Zen+. Už se objevily specifikace nového Ryzen 5 2600, kde při zachování TDP vzrostla turbo frekvence z 3,6 na 3,8 GHz, čili žádný zázračný růst přes 4 GHz se zatím nekoná. Také bude aktualizovaná řada ThreadRipperů, která má nabídnout až 32 jader a max. turbo frekvenci 4,4 GHz.
      20.3.2018 Izraelská bezpečnostní firma CTS Labs odhalila 4 typy zranitelností na nových procesorech a chipsetech AMD. Tři z nich (Masterkey, Ryzenfall a Fallout) se týkají PSP (Platform Security Processor - obdoba intel ME) integrovaného v procesorech Ryzen a EPYC a jedna (Chimera) pak embedded procesoru v chipsetu Promontory, který pro AMD vyvinula firma ASMedia. Více podrobností v tomto videu. Nebylo prokázáno, že by bylo možné tyto zranitelnosti exploitovat vzdáleně, je pro to potřebný lokální root přístup. Je trochu nestandardní, že CTS Labs vyrozuměla AMD o problému pouhých 24 hodin před zveřejněním. AMD předpokládá, že se dané zranitelnosti podaří vyřešit softwarově aktualizacemi firmware.
      10.4.2018 AMD vydává záplatu na zranitelnost Spectre, která vyžaduje jak aktualizaci OS (Windows / Linux), tak aktualizaci mikrokódu, jenž je k dispozici i na starší procesory až po generaci Bulldozer z roku 2011.

Alternativní výrobci x86

      17.4.2018 Kdysi býval procesorový svět x86 mnohem pestřejší než dnes nudný, dosti asymetrický, duopol intel - AMD. Kdo si dnes vzpomene na x86 procesory značek NEC, SONY, Fujitsu, Siemens, Harris, OKI, Texas Instruments, Cyrix, UMC, ST, NexGen, IBM, IDT, Rise, Transmeta... První generace procesorů x86 byly oproti těm dnešním nepoměrně jednodušší, takže bylo možné zjistit jejich funkci reverzním inženýrstvím a kde kdo tak mohl vyrábět svoje klony. Později, jak rostla složitost, tak prostí replikátoři odpadli a udrželi se jen ti s vlastním návrhem x86 jádra. Zajímavý přístup zvolila firma Transmeta, jejíž procesory Crusoe obsahovaly dynamický translátor x86 instrukcí CMS na proprietární VLIW instrukce. Nejdále to dotáhla tchajwanská firma VIA, od procesorů C3 pro Socket 370 po 4-jádrové procesory Nano vyráběné 40nm technologií pro embedded segment. Po letech stagnace nyní VIA chytá druhý dech a po spojení s čínskou firmou Zhaoxin vydává novou generaci 4 a 8 jádrových procesorů řady KX vyráběných 28nm technologií s výhledem na 16 nm. Zásadním vylepšením je integrace paměťového řadiče DDR4 a podpora PCI-E 3.0, USB 3.1, SATA 3. Frekvence je ale jen 2 GHz, na 16 nm by mohlo být dosaženo 3 GHz. Zatím mají být tyto procesory vyráběny pro potřeby čínského trhu.
      Rusko už poměrně dlouho vyvíjí vlastní VLIW procesory Elbrus, které implementují dynamický překlad x86 instrukcí podobně jako Transmeta. Poslední model Elbrus-8S obsahuje 8 jader, běží na 1,3 GHz a vyrábí ho TSMC 28nm technologií. Integruje 4-kanálový paměťový řadič DDR3 s ECC a 16 MB L3 cache. Už se také objevily první PC osazené s tímto procesorem, na kterých běží Linux-based systém Elbrus OS. Žádný aktuální benchmark jsem nenašel, jen že starší 4-jádrový procesor Elbrus-4S na 800 MHz by měl být v x86 zhruba na úrovni Pentia-M či Atomů.
      Nakonec ještě zmíním tchajwanskou firmu DMP Electronics, která vyrábí SoC procesory Vortex86 pro embedded segment. Jsou to takové low-power 486-tky / Pentia na steroidech běžící až na 1 GHz s integrovaným paměťovým řadičem DDR3 a řadou periferií. Nepodporují instrukci CMOV, takže na nich neběží běžně kompilovaný kód pro 686. S těmito procesory se vyrábí řada roztomilých malých základních desek až po miniaturní 86Duino kompatabilní s Arduinem.



Zpět

Aktualizováno 21.11.2018 v 00:12

„Žití, to je největší umění na světě, neboť většina lidí pouze existuje.“ Oscar Wilde