Je Assembler mrtvý?
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu
Reklama

Je Assembler mrtvý?Je Assembler mrtvý?

 

Je Assembler mrtvý?

Google       Google       10. 12. 2005       19 776×

Pokud do programu potřebujem přidat časově náročnou funkci, můžeme ji napsat v Assembleru (dále jen Asm). Někdo říká že Asm je už mrtvý jazyk a nevyplatí se ho učit. My si v několika příkladech ukážeme, že to není tak docela pravda a že zrychlení je někdy i několikanásobné...

Reklama
Reklama

V době nových instrukčních sad, dodávaných k procesorům, se může zdát že Asm už je mrtvý. Může se zdát, že instrukční balíčky (MMX, SSE, SSE2, SSE3 od Intelu, 3Dnow! od AMD) spolu s novými optimalizačními metodami kompilátorů jsou v rychlosti neporazitelné a mnozí to v diskuzích tvrdě hlásají. My si však ale ukážeme na obyčejných funkcích s poli, že to není tak docela pravda a určitě se vyplatí přepsání kritických funkcí programů do Asm. Příklady budu psát v C++.

Instrukční sady

Co to vlastně jsou ty instrukční sady? Jsou to balíčky instrukcí, které se dodávají k procesoru. Jedná se hlavně o předam dané instrukce pro některé často používané matematické operace nebo operace s videem a zvukem (MMX), které často urychlí výkon procesoru u některých aplikací.

Takže první jednoduchý příklad bude se záměnou 2 polí mezi sebou. První funkci, kterou si napíšeme, je pro výpis pole na obrazovku.


// vypise na obrazovku pole o delce promenne delka
void vypisPole( int *pole, int delka )
{
	int i;
	for(i=0; i<delka; i++)
	{
		cerr << pole[i] << endl;
	}	
}

Pro všechny, kdo trochu ovládají C++, to musí být uplně jasné, pro ty ostatní doporučuji kurz C++ zde na e-zinu. Dalé si napíšeme klasickou funkci pro záměnu dvou polí mezi sebou.


// vzajmne prohodi 2 pole mezi sebou
void prohodPole(int *pole_a, int *pole_b, int delka )
{
	int temp;
	int i;
	for(i=0; i<delka; i++)
	{
		temp = pole_a[i];
		pole_a[i] = pole_b[i];
		pole_b[i] = temp;
	}
}

Do C si zapíšeme A, do A si zapíšeme B a do B si zapíšeme C :). To je druhý ročník střední školy, taky nic těžkého. Napíšeme si taky tu samou funkci v Asm.


// funkce v JSA pro prehozeni dvou poli
void prohodPoleAsm(int *pole_a, int *pole_b, int delka )
{
	int temp;
	_asm
	{
		mov ecx, delka
		mov eax, pole_a
		mov ebx, pole_b

	nav:
		mov temp, ecx
		
		// prohozeni
		mov ecx, [eax]
		mov edx, [ebx]
		mov [eax], edx
		mov [ebx], ecx
			
		add eax, 4
		add ebx, 4
		mov ecx, temp
		DEC ecx
		JNZ nav
	}
}

Jako parametry funkce se dávají 2 ukazatele na pole a délku pole. Registr ecx slouží jako 32 bitový čítač pro průběh cyklu. Do registrů eax a ebx si uložíme odkazy na obě pole. Potom už máme vlastní návěstí "nav", ve kterém probíhá vlastní výměna hodnot pole. Jako první v cyklu si uložíme registr ecx do proměnné temp, protože registr budem potřebovat pro řešení výměny pole (určitě by se to dalo vyřešit líp). Následuje vlastní prohození polí mezi sebou (do C dej A, do A dej B... ) a potom posuneme ukazatele na pole o 4 bity, abychom mohli v dalším projetí těla cyklu pracovat s dalšími prvky pole. No a na konec už jenom vrátíme skutečnou hodnotu do registru ecx, dekrementujeme ho, aby se smyčka neprováděla do nekonečna a skočíme na návěstí. Instrukce JNZ vrací průběh programu na návěstí "nav" pokud se ecx nerovná nule.

Funkce main:


int main(int argc, char* argv[])
{
	const int delka = 6;
	int poleA[] = {5,5,5,5,5,5};
	int poleB[] = {2,2,2,2,2,2};

	X_ExactTimer time;

	time.Start();
	vypisPole( poleA, delka );
	vypisPole( poleB, delka );
	// smycka ktere prechodi 100001*6*2 promenenych mezi sebou
	int i;
	for(i=0; i < 100001; i++)
	{
		// zkuste zakomentovat jednotlive funkce a zjistit rychlost
		// dannych funkci, funkce prohodPoleAsm by mela byt rychlejsi
		//prohodPole( poleA, poleB, 6);
		prohodPoleAsm( poleA, poleB, 6);
	}
	cerr << "PROHOZENI" << endl;
	vypisPole( poleA, delka );
	vypisPole( poleB, delka );
	time.End();
	cerr << "Cas : " << time.CalkTime() << endl;
	return 0;
}

Možná vás tam mate ta třída X_ExactTimer, ale je to třída z mého enginu pro přesné měření funkcí. Hodí se právě na tyto situace, kdy potřebujete zjistit, co je rychlejší. Funguje uplně stejně jako stopky.

Závěr

Na mém počítači (AMD 1800) se funkce bez použití Asm prováděla něco kolem 18.4381. S použitím Asm to bylo kolem 11.623. Nebudu počítat, o kolik procent byla Asm funkce rychlejší, ale závěr si udělejte sami.

Zdrojové kody zde.

Další příklad bude jdnoduché nulování pole. Budeme vycházet z předchozího příkladu.


void nulujPole( int *pole, int delka )
{
	int i;
	for(i=0; i<delka; i++)
	{
		pole[i] = 0;
	}	
}

A tady to samé jenom v Asm:


void nulujPoleAsm( int *pole, int delka )
{
	_asm
	{
		mov eax, pole
		mov ecx, delka
	nav:
		mov eax, 0 // s xor by melo byt rychlejsi nulovani
		add eax, 4
		dec ecx
		jnz nav
	}
}

Do eax si dáváme ukaztel na pole a do ecx délku pole, stejně jako v přechozím případě. V cyklu potom pole jen vynulujeme a zbytek je zase stejný jako předtím.

Výsledek

S normální funkcí něco kolem 12.965 a s Asm funkcí to bylo nějak okolo 8.123. Hodně záleží, co máte za počítač.

Zdrojové kody zde.

Jeden zajímavý článek naleznete zde :).

×Odeslání článku na tvůj Kindle

Zadej svůj Kindle e-mail a my ti pošleme článek na tvůj Kindle.
Musíš mít povolený příjem obsahu do svého Kindle z naší e-mailové adresy kindle@programujte.com.

E-mailová adresa (např. novak@kindle.com):

TIP: Pokud chceš dostávat naše články každé ráno do svého Kindle, koukni do sekce Články do Kindle.

Hlasování bylo ukončeno    
0 hlasů
Google
Autor programuje v C++, Pascalu, JSA a zajímá se o 3D grafiku.

Nové články

Obrázek ke článku Malware KONNI se úspěšně skrýval 3 roky. Odhalil ho bezpečnostní tým Cisco Talos

Malware KONNI se úspěšně skrýval 3 roky. Odhalil ho bezpečnostní tým Cisco Talos

Bezpečnostní tým Cisco Talos odhalil celkem 4 kampaně dosud neobjeveného malwaru, který dostal jméno KONNI. Ten se dokázal úspěšně maskovat od roku 2014. Zpočátku se malware zaměřoval pouze na krádeže citlivých dat. Za 3 roky se ale několikrát vyvinul, přičemž jeho současná verze umožňuje útočníkovi z infikovaného počítače nejenom krást data, ale i mapovat stisky na klávesnici, pořizovat screenshoty obrazovky či v zařízení spustit libovolný kód. Pro odvedení pozornosti oběti zasílali útočníci v příloze také obrázek, zprávu a výhružkách severokorejského režimu či kontakty na členy mezinárodních organizací.

Reklama
Reklama
Obrázek ke článku Pouze jedna z deseti lokálních firem ví o pokutách plynoucích z GDPR

Pouze jedna z deseti lokálních firem ví o pokutách plynoucích z GDPR

Trend Micro, celosvětový lídr v oblasti bezpečnostních řešení a VMware, přední světový dodavatel cloudové infrastruktury a řešení pro podnikovou mobilitu, oznámily výsledky výzkumu mezi českými a slovenskými manažery zodpovědnými za ochranu osobních údajů, který zjišťoval, jak jsou připraveni na nové nařízení o ochraně osobních údajů (GDPR). Většina firem v České republice a na Slovensku nad 100 zaměstnanců je již s novým nařízením GDPR obeznámena. Výzkum provedený ve spolupráci s agenturou Ipsos ukázal, že téměř 8 firem z 10 o nařízení ví, přičemž jeho znalost je o něco vyšší na Slovensku (89 %) než v České republice (69 %).

Obrázek ke článku Vyděračský software Locky se vrací, tváří se jako potvrzení platby, odhalil tým Cisco Talos

Vyděračský software Locky se vrací, tváří se jako potvrzení platby, odhalil tým Cisco Talos

Jeden z nejznámějších ransomwarů, Locky, se vrací. Po většinu roku 2016 patřil mezi nejrozšířenější vyděračské softwary. Ke svému šíření využíval emailové kampaně s infikovanými přílohami. Ransomware Locky byl rozesílán prostřednictvím botnetu (internetový robot zasílající spamy) Necurs. Jeho aktivita na konci roku 2016 téměř upadla a spolu s ní i šíření ransomwaru Locky. Před několika týdny se Necurs opět probudil a začal posílat spamy nabízející výhodný nákup akcií. Dne 21. dubna zaznamenal bezpečnostní tým Cisco Talos první velkou kampaň ransomwaru Locky prostřednictvím botnetu Necurs za posledních několik měsíců.

Obrázek ke článku Dovozci baterií mění logistiku, letadlo nahrazuje námořní doprava

Dovozci baterií mění logistiku, letadlo nahrazuje námořní doprava

Dovozci baterií do mobilů či notebooků upouštějí od letecké přepravy zboží. V letošním roce plánují dovézt až 80 % produktů lodí. Přitom před 5 lety byla většina baterií do mobilních přístrojů dovezených do České republiky přepravována letadlem. Za proměnou způsobu transportu akumulátorů stojí zpřísnění pravidel pro leteckou přepravu, která přinášejí vyšší náklady i náročnou agendu.

loadingtransparent (function() { var po = document.createElement('script'); po.type = 'text/javascript'; po.async = true; po.src = 'https://apis.google.com/js/plusone.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(po, s); })();
Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032017 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý