Zakaj imam 12 jeder, če pa jih ima moj procesor samo 6
S pojmom in tehnologijo Hyper Threading (HT) smo se prvič srečali davnega leta 2002 z izdajo Intelovih procesorjev Pentium 4. To funkcijo smo srečevali tudi na kasnejših Pentium 4 HT in na vseh različicah Extreme – vse do prihoda serije Core. HT je poniknil in ga do konca leta 2008 nismo več videli. Takrat se je pojavil znova, v novi generaciji procesorjev – Nehalem. Tehnologija je ponovno med nami že dve leti, o njej pa pravzaprav ne vemo veliko. Če vprašamo koga, ki se vsaj malo spozna na računalnike, bo dejal, da je to super funkcija, ki nam podvoji procesorska jedra. V resnici pa nima pojma, kaj dejansko je ta funkcija. Da nam podvoji število jeder v procesorju, je res, fizično jih je pol manj, kar ne pomeni dvakratne pohitritve.
Princip delovanja
Če imamo dve fizični jedri, s HT-jem dobimo štiri. To ne pomeni, da ima naš procesor štiri jedra, kaj šele da je enako hiter kot procesor z dejanskimi štirimi jedri. HT nam zraven fizičnega jedra naredi eno navidezno jedro. Operacijski sistem ima zato na voljo dve jedri, med kateri lahko porazdeli delo. Do sem je tehnologija videti transparentna. V resnici pa HT podvoji določene dele procesorja zaradi posebnih registrov. Delo, ki ga operacijski sistem razdeli na dve jedri, v resnici opravlja samo eno jedro. A ker se en ukaz ne izvaja ves čas, ima procesor proste cikle. Slednje izkoristi tehnologija HT in preko navideznega jedra zapolni praznine med nalogami oz. ukazi. Tako je v bistvu en procesor bolj učinkovit, saj ne čaka na delo. Pohitritev, ki jo v teoriji dobimo s to tehnologijo, je okrog 30-odstotna. Glede na to, da dodatni registri zasedejo le 5 % celotne površine jedra, je pohitritev za 30 odstotkov efektivna.
Uporaba HT-ja
Te funkcije ne bomo izkoristili, če bomo brskali po spletu in gledali filme na YouTubu. Tehnologija je primerna za tiste aplikacije, ki znajo dobro delati z večnitnostjo. Naš enojedrni procesor s tehnologijo HT bo lahko uporabil dve niti za izvajanje enega programa, kar pomeni, da bo program deloval hitreje, kot če bi naš procesor bil brez omenjene tehnologije. S HT-jem največ pridobijo predvsem tisti sistemi, ki opravljajo zahtevnejše računske operacije, ki so prisotne pri kodiranju filmov, modeliranju in podobnih nalogah. V domačem okolju pa povprečni uporabnik razlike ne bo opazil, razen očitne – da ima dvakrat več jeder.
Princip testiranja in naš testni sistem V laboratoriju nas je dolgo pestilo vprašanje, koliko se Hyper-Threading zares pozna. Vedeli smo, da se za navzven logično funkcijo skriva več, kot je vidnega s prostim očesom. Sledila je najbolj logična izbira, da zadevo zares preizkusimo. Tega smo se lotili na razmeroma enostaven način, ki je vključeval sodoben procesor iz Intelove zadnje serije. Osnovni načrt je bil, da bomo najprej preizkusili procesor tak, kot je, nato pa teste ponovili z izklopljeno funkcijo HT. Slednja opcija je na voljo v BIOS-u matične plošče in jo je priporočljivo izklopiti, če vaš operacijski sistem ne podpira Hyper-Threadinga – Windows 2000 na primer.
Naš testni sistem je vseboval Intelov zadnji procesor iz serije Core i7, in sicer model i7-970. Tega smo namestili na osnovno ploščo Gigabyte X58A-UD7, skupaj s štirimi gigabajti DDR3 pomnilnika in grafično kartico GeForce GTX275. Na hibridni disk Seagate Momentus XT smo namestili 64-bitno različico operacijskega sistema Windows 7 Ultimate z najnovejšimi gonilniki.
Upravitelj opravil
Tako je bil med našim testiranjem videti upravitelj opravil (Task Manager).
 6 fizičnih jeder, vklopljen HT |
 6 fizičnih jeder, brez tehnologije HT |
 aktivna 3 jedra, brez HT |
Intel Core i7-970

Naš test bazira na procesorju i7-970, ki ga je letošnje poletje predstavil Intel. Je prvi šestjedrnik redne serije, ki ima z ekstremnim i7-980x (Extreme Edition) veliko skupnega. Ima šest fizičnih jeder, narejen je v 32-nm tehnološkem procesu in ima 12 MB L3 predpomnilnika. Njegova frekvenca je za 133 MHz manjša, kar znese 3,2 GHz. Turbo Boost mu frekvenco poviša na 3,46 GHz, ko je to potrebno. Razlika v primerjavi z 980x pa ni samo v manjši frekvenci, temveč tudi v zaklenjenem množilniku. Ta pa je tisti, ki naredi razliko med navadno in ekstremno različico, zato nam ni povsem jasno, kaj so razmišljali pri Intelu, ko so ceno za procesor postavili na 885 ameriških dolarjev, če pa je cena za 980x le malenkost večja, in sicer 999 ameriških zelencev. Brez obotavljanja lahko temu rečemo polom in verjamem, da se boste vsi strinjali z nami. Če že dajemo tako ogromno vsoto denarja za procesor, zakaj ne bi dodali teh borih 100 dolarjev in dobili Intelovega najhitrejšega procesorja. Zaključimo lahko, da i7-970 vsekakor ni za množice – vsaj cenovno ne, če ga že Intel uvršča med »normalne« Core i7 procesorje.
Splošni testi
Omenjen testni sistem smo za začetek obremenili s testi, ki preverjajo splošno zmogljivost. Performance Test in PCMark Vantage ocenita celoten sistem, ne samo enega dela računalnika. S programom 7-Zip smo preverili računsko moč procesorja pri stiskanju datotek. Sledil je še test multimedijske zmogljivosti procesorja v programu Sandra. Za konec »splošnih« testov smo pognali še testni program igre Lost Planet 2, in sicer v načinu A pri ločljivosti 1280 x 720 na privzetih nastavitvah.
Teste smo na enakem sistemu pognali trikrat. Prvič z vklopljenim HT-jem, drugič pa z izklopljenim. Za tretji krog smo poleg tega, da je bil izklopljen Hyper-Threading, izklopili še tri jedra, tako da je procesor deloval samo s tremi. Rezultati, ki smo jih dobili, so zanimivi. Pričakovali smo, da se bo v testih najbolje izkazal ne-hendikepiran procesor. Temu ni bilo tako, saj se je ta najbolje odrezal le pri dveh testih, in sicer pri Performance Testu in pri Sandri. Presenetljivo bolje se je izkazal sistem brez HT-ja, kjer je blestel v vseh ostalih testih – tudi v PCMark Vantage. Da bo isti sistem s samo tremi jedri slabši, smo pričakovali, a glej ga zlomka! V testu Lost Planet 2 je pokosil obe ostali nastavitvi in to za kar dve sličici na sekundo.
Dobljeni rezultati so že pokazatelj tega, kje se HT obnese – pri težkih računskih operacijah, kar je pokazala tudi Sandra. Naj povemo še to, da rezultata pri 7-Zipu za prvo konfiguracijo nismo mogli točno izmeriti, ker nismo imeli dovolj pomnilnika. A že s samo osmimi nitmi (namesto 12) je rezultat veliko boljši.
|
| HT vključen |
HT izključen |
3 jedra, HT izključen |
|---|
| Performance test 64-bit |
1879 |
1829 |
1626,9 |
|---|
| PcMark Vantage |
9724 |
10002 |
9223 |
|---|
| 7-Zip 32 MB |
21677 |
19044 |
6826 |
|---|
| Sandra XII CPU Multi-Media (MPixel/s) |
/ |
188 |
94 |
|---|
| Lost Planet 2 (A) |
88,3 |
87 |
90,1 |
|---|
Urejanje slik
Testna slika v procesu obdelave v Photoshopu
Naslednji test, ki smo ga preizkusili na testnem računalu, je zajemal vsem poznan program Photoshop. V različico CS5 smo dodali testno akcijo. Ta je na sliki naredila izbrane filtre, efekte in druge modifikacije. Test HH PSBench V3 je zajemal 15 akcij, ki smo jih izvajali na testni sliki. Merili smo čas, ki ga je računalnik potreboval za izvedbo, in rezultat zapisali v tabeli. Resolucija slednje je znašala 7000 x 5443 slikovnih točk, datoteka s sliko pa je bila velika 12 MB (precej zajetna slika, za katero smo mislili, da bo računalnik dobro obremenila). V upanju na velike razlike smo test pognali na treh različnih nastavitvah sistema.
Gledanje vseh rezultatov v tabeli nima smisla. Dovolj je, če pogledamo seštevek vseh časov, kjer se še najbolje vidijo razlike. Ne rabimo biti mojstri, da opazimo razliko, ki je praktično ni. Sicer res, da je ne-hendikepiran sistem boljši od obeh ostalih nastavitev (manjši seštevek pomeni boljši rezultat), a je razlika tako mala, da ne igra bistvene vloge. Zaključimo lahko, da je za Photoshop vseeno, če imate šestjedrni ali trijedrni procesor.
|
| HT vključen |
HT izključen |
3 jedra, HT izključen |
|---|
| Texturiser |
1,2 |
1,2 |
1,1 |
|---|
| CMYK |
0,6 |
0,8 |
1,3 |
|---|
| RGB |
0,7 |
0, |
1,1 |
|---|
| Ink Outlines |
17,8 |
17,8 |
17,8 |
|---|
| Dust & Stratches |
1,1 |
1 |
1,7 |
|---|
| Watercolor |
17,9 |
17,9 |
17,9 |
|---|
| Texturiser |
1,3 |
1,3 |
1,2 |
|---|
| Stained Glass |
9,1 |
9 |
9 |
|---|
| Lighting |
1,2 |
1,1 |
1,6 |
|---|
| Mosiac |
9,3 |
9,3 |
9,3 |
|---|
| Extrude |
71,4 |
71,3 |
71,4 |
|---|
| Smart Blur |
42,2 |
42,1 |
42,3 |
|---|
| Underpainting |
18,2 |
18,3 |
18,3 |
|---|
| Palette |
15,3 |
15,4 |
15,4 |
|---|
| Sponge |
24,6 |
24,8 |
24,8 |
|---|
| Skupno |
231,9 |
232 |
234,2 |
|---|
Izris slik (rendering)
12 jeder v akciji (»Team work«) pri izrisu slike v programu Cinebench 11.5
Pri težkih računskih operacijah, kot je izrisovanje modelov, pa mora pokazati razlike. Zato smo uporabili dve različici programa Cinebench, in sicer staro (R10) ter novo (R11,5). Pri obeh smo gledali dva rezultata – za procesor ter grafično kartico. Kot poprej smo teste poganjali na treh različnih nastavitvah. Rezultati se skladajo s teorijo, ki smo jo zapisali v uvodu, da se HT pozna pri težkih računskih operacijah. Obe različici programa Cinebench sta to zelo jasno pokazali, saj je sistem s šestimi jedri in vključenim Hyper-Threadingom pometel s preostalima dvema nastavitvama sistema. Razlika med vključeno in izključeno funkcijo HT ni tako zanemarljiva in jasno vidimo, da HT kar precej pomaga pri hitrejšemu izrisovanju. Tako opravilo je zelo odvisno od hitrosti procesorja in števila njegovih jeder, kar se jasno pokaže v zadnjem stolpcu, kjer so rezultati skoraj dvakrat slabši.
|
| HT vključen |
HT izključen |
3 jedra, HT izključen |
|---|
| Cinebench R10 64-bit |
|
| |
|---|
| Multi CPU Rendering (CB-CPU) |
27027 |
23907 |
13066 |
|---|
| OpenGL Standard (CB-GF X) |
6757 |
6763 |
6335 |
|---|
| Cinebench R11.5 64-bit |
|
| |
|---|
| CPU (pts) |
8,57 |
6,68 |
3,43 |
|---|
| OpenGL (fps) |
39,40 |
38,89 |
40,72 |
|---|
Kodiranje filmov
Več računske moči, kot je zahteva program ali opravilo, večja je razlika med dobrim in slabim procesorjem. Eno izmed procesorsko zahtevnih opravil je kodiranje filmov. Pri filmih visoke ločljivosti (HD) je še toliko bolj zahtevno, saj je kvaliteta dobra, kar pomeni več podatkov za procesiranje. Naš test je vključeval 30-sekundni posnetek napovedi filma v HD 720p ločljivosti (1280 x 720), velik slabih 60 MB. Ta se je iz surovega HD-formata pretvarjal s pomočjo x.264 video kodirnika. Test je potekal v dveh prehodih. V prvem prehodu je test opravljal nalogo, opisano v prejšnjem stavku, v drugem prehodu pa je že pretvorjeno datoteko še enkrat pretvoril v še manjši video posnetek – ta je bolj obremenjujoč za sistem, zato so rezultati opazno slabši. Za razliko od prejšnjih testov smo tukaj vključili še dodatno nastavitev istega sistema, kjer smo pri nastavitvi s tremi jedri vključili HT. Ker smo bili nad zares različnimi rezultati tako navdušeni, smo v test vključili še naš hišni računalnik, ki ga poganja Intel Core 2 Extreme QX9770 (3,2 GHz, 4 fizična jedra brez HT). Rezultati so podani v dveh tabelah – prva prikazuje, s kolikšnim številom sličic na sekundo se je film dekodiral, druga pa prikazuje pretok podatkov, merjenih v kilobajtih na sekundo. Rezultati so najbolje vidni, če pogledamo povprečja za posamezen Pass in jih primerjamo z različnimi konfiguracijami. Rezultati so zanimivi, saj so rezultati s HT-jem nekoliko slabši – v prvem prehodu. V drugem prehodu, ki je za sistem bolj intenziven, pa se je HT dobro izkazal.
Če za konec rezultate primerjamo z našim hišnim računalnikom, vidimo, da ni vse v številu jeder in tehnologijah, temveč tudi v ostalih stvareh, zaradi katerih je trenutna generacija preprosto boljša.
| FPS |
HT vkl. |
HT izkl. |
3 jedra, HT vključen |
3 jedra, HT izključen |
QX9770 |
|---|
|
| 86,06 |
86,15 |
71,43 |
76,84 |
78,24 |
|---|
|
| 86,06 |
86,15 |
71,43 |
77,16 |
70,50 |
|---|
|
| 86,06 |
86,15 |
71,43 |
76,27 |
70,18 |
|---|
|
| 85,67 |
86,31 |
71,16 |
75,64 |
70,42 |
|---|
| Prehod 1 povpr. |
85,96 |
86,19 |
71,36 |
76,48 |
72,34 |
|---|
|
| 44,36 |
36,48 |
23,97 |
17,33 |
21,01 |
|---|
|
| 44,27 |
36,42 |
23,94 |
17,43 |
20,70 |
|---|
|
| 44,18 |
36,25 |
23,96 |
17,25 |
21,19 |
|---|
|
| 44,02 |
36,42 |
23,94 |
17,36 |
20,34 |
|---|
| Prehod 2 povpr. |
44,21 |
36,39 |
23,95 |
17,34 |
20,81 |
|---|
| KB/s |
HT vkl. |
HT izkl. |
3 jedra, HT vključen |
3 jedra, HT izključen |
QX9770 |
|---|
|
| 3901,99 |
3898,70 |
3898,70 |
3899,90 |
3901,21 |
|---|
|
| 3902,42 |
3898,70 |
3898,70 |
3899,90 |
3901,21 |
|---|
|
| 3901,99 |
3898,70 |
3898,70 |
3899,90 |
3900,68 |
|---|
|
| 3901,99 |
3898,70 |
3898,42 |
3899,90 |
3900,68 |
|---|
| Prehod 1 povpr. |
3902,10 |
3898,70 |
3898,63 |
3899,90 |
3900,95 |
|---|
|
| 3917,04 |
3969,89 |
3971,68 |
3971,58 |
3971,65 |
|---|
|
| 3971,71 |
3956,86 |
3960,31 |
3970,52 |
3966,96 |
|---|
|
| 3933,60 |
3950,22 |
3970,49 |
3971,77 |
3970,99 |
|---|
|
| 3883,07 |
3964,59 |
3949,67 |
3971,42 |
3970,98 |
|---|
| Prehod 2 povpr. |
3926,36 |
3960,39 |
3963,04 |
3971,32 |
3970,15 |
|---|
Zaključek
Igričarji od HT-ja ne bodo imeli toliko kot npr. tisti, ki se ukvarjajo s procesiranjem video posnetkov ali z modeliranjem. Slednji imajo dejansko korist od te tehnologije, prvim se pa samo fino zdi, da ima njihov računalnik dvakrat večje število jeder. Testi, ki smo jih opravili, so jasen pokazatelj, kaj tehnologija Hyper-Threading je. Izboljša zmogljivost računalnika, a le v določenih, sistemsko intenzivnih aplikacijah, kjer šteje vsak atom moči. HT ni tako efektiven, da bi ob izbiri procesorja za računalnik igral veliko vlogo. Bolje se je osredotočiti na število fizičnih jeder in na njihovo hitrost, saj bo večje število le-teh bolj vplivalo na zmogljivost.