En tråd för att diskutera AMD's kommande mikroarkitektur Bulldozer.
En Bulldozer FAQ kommer att dyka upp när det är dags, precis som med min Phenom II FAQ.
Tillsvidare så kan vi ha lite kort info om Bulldozer och några presentationsbilder.
Inledning
Först och främst så är detta något både jag och många väntat på, en ny mikroarkitektur från AMD. Det har inte skett sedan 1999 då första Athlon processorn lanserades (K7). I dagens Phenom II processorer så är det fortfarande optimerade K7 kärnor, vilket ganska få är medvetna om. Bulldozer är något helt nytt.
Annorlunda
Hur AMD kommer marknadsföra Bulldozer är oklart då detta är nytänkade. En Bulldozer processor med 4st moduler, det kan på marknaden bli en 4 kärnig processor som kan hantera 8 trådar, eller helt enkelt en 8 kärnig processor då det faktiskt är 8 äkta kärnor.
Ett exempel: En Bulldozer processor med 4 moduler kommer att uppfattas som 8 äkta kärnor av datorn för dom som inte förstått.
Bulldozer - en modul
Bulldozer konstrueras i form av moduler. En modul är 2 beräkningskärnor med varsin 128-bit FPU som kan agera som en 256-bit FPU vid AVX instruktioner. Beräkningskärnorna delar på resurser som avkodare, schemaläggare, fetchers samt en egen dedikerad L2 cache som också används av FPU'erna. Moduler tillsammans delar i sin tur på en L3 cache.
Branch och fetch
Bulldozers branchpredictor och fetch enheter är separerade för att skapa mindre flaskhalsar, något som är viktigare i denna arkitekturen med dess längre pipeline.
Mer djupgående i en Bulldozer-modul och beräkningsenheterna
Den extra beräkningskärnan hos Bulldozer använder 12.5% mer kärnyta, men levererar ~80% högre prestanda jämfört med 1 kärna och är alltså mycket lik en CMP, men rejält mycket mindre. Flertrådsteknik (Hyperthreading t.ex) kan i bästa fall ge 25-30% mer prestanda och kräver inte långt ifrån lika mycket transistorer. Flertrådsteknik har sitt syfte att utnyttja processorns pipelines. Bulldozers modul-uppbyggnad har istället syftet att hårdare utnyttja avkodare, schemaläggare och L1/L2 cacher till redan effektiva pipelines.
Den första förbättringen utöver modul-uppbyggnaden man ser är avkodaren som nu är 4-vägs, mot tidigare 3-vägs. Dessa matar schemaläggarna i processorn för dom olika pipelineenheterna och FPU(erna), 2st för ALU/AGU och 2st för FPU schemaläggaren. I Bulldozer så är schemaläggarna också unifierade, vilket innebär att resurserna används desto mer effektivt. Tidigare så har matematikenheterna (ALU'er) haft en dedikerad schemaläggare, och adressenheterna (AGU'er) likaså. Detta ökar effektiviteten hos Bulldozer. Utnyttjandet av enheterna på detta sätt ihop med en extra decoder kan ge stor inverkan på prestanda under heltalsoperationer. Som en jämförelse så kan Nehalem som bäst göra 4 micro-ops. Nehalem har dock inte oberoende schemaläggare vilket gör att Bulldozer kan hålla sina decoders fullt utnyttjade som i sin tur matar ALU/AGU/FPU.
Flyttalsberäkningar ser också lovande ut hos Bulldozer med sina 128-bit FMAC's som är delade. Det finns också 2st MMX FPU'er för vanliga x87/MMX instruktioner. Schemaläggaren hos FPU'n klarar 2 trådar som tidigare nämnt och FPU'ns resurser beter sig som en flertrådad enhet. XMM registren är 256-bit och Bulldozer stödjer AVX, AES och LWP fullt ut inklusive XOP och FMA4 instruktions-set: http://support.amd.com/us/Processor_TechDocs/43479.pdf
Äntligen finns också fullt stöd för SSE4 (SSE4.1 och 4.2). Detta kommer göra prestandaskillnaden ännu större från dagens Phenom II då den har avsaknad för dessa instruktionsuppsättningar.
Processorns cache-prefetchers kommer vara betydligt mer aggressiva än tidigare och ställa desto mer krav på både cachenivåer och minnesbandbredd. Hur minneskontrollern är konstruerad och specificerad går inte av avslöja ännu. Lägre accesstid och högre bandbredd är att vänta dock.
AMD Turbo Core
Slutligen så kommer version 2 utav AMD's Turbo Core Teknologi att debutera i Bulldozer. Moduler kan stängas av och på helt och hållet dynamiskt oberoende av varandra och klockfrekvenserna kan ökas mer under Turbo-läge. Processorn har helt själv koll på strömkonsumption som bevakas i Turbo-läge.
![]()



2Likes
LinkBack URL
About LinkBacks



















Svara med citat








Bokmärken