Este texto trabajará sobre Windows y para aplicaciones de 32 bits. También decir que se utilizará Flat Assembler, que es Open Source y gratuito, puedes obtener su ultima versión aquí:
http://flatassembler.net/download.php
Dicho esto, comencemos.
VARIABLES Y REGISTROS.
En ensamblador no existen las variables de tipo int, long, string y etc. Las variables pueden ser DWORD (4 bytes), WORD (2 bytes) o BYTE (1 byte).
Una variable de tipo DWORD se declara así:
Código
mivariable dd 0
Donde mivariable es el nombre que le damos a la variable, con el dd de indicamos que es un DWORD y el 0 indica que le damos como valor inicial un valor nulo, osea, cero.
La declaración para un WORD:
Código
mivariable dw 0
y para el BYTE:
Código
mivariable db 10
Con el 10 le indicamos que es una variable con tamaño de 10 bytes.
Luego estan los registros del microprocesador, que són los siguientes:
- EAX
- EBX
- ECX
- EDX
Los registros tienen un tamaño de 4 bytes ya que estamos programando para 32 bits.
Los podrémos usar como punteros o para almacenas información (que no supere los 4 bytes).
Estos 4 registros son de uso general, es decir son los guerreros a pie de nuestro programa. Con ellos podremos mover información de unas variables a otras, recibir el retorno de las funciones del sistema o realizar operaciónes como multiplicar o dividir.
Además de esos 4 registros también tenemos los registros EDI y ESI. Estos registros los podemos usar también como los anteriores, aunque su propósito es otro. Normalmente complementan algunas intrucciones. También se verá mas adelante su utilidad.
Los registros EBP y ESP son los que indican la parte baja y la parte alta de la pila, que se explicará a continuación.
Y por último el registro EIP, este es el que indica la posición en memoria de la instrucción que se esta ejecutando. Cuando depuremos nuestra aplicación mas adelante veremos su uso.
Como aclaración decir que todos los registros tienen una capacidad de 4 bytes.
LA PILA
La pila es una "estructura", en la que almaceramos información para pasarle argumentos a nuestras funciones. Para que lo entendaís mejor, si yo quiero llamar a la API MessageBoxA lo que haré será meter sus 4 parametros en la pila y entonces llamar a la función.
La pila tiene una base, que la indica el registro EBP y una parte alta, que la indica el registro ESP.
Cada vez que introducimos un valor en la pila el registro ESP decrementa en 4. Este registro tiene que estar siempre estable ya que si no es así nuestra aplicación estallará.
Aquí entran en juego las convenciones de llamada. Esta el tipo stdcall, que es el que usa Windows y el cdecl, que lo usan algunas librerías como las de C.
En el caso de que la llamada sea de tipo stdcall NO tenemos que restaurar el registro ESP, ya que lo hace la propia función, sin embargo si es cdecl, si la tendremos que restaurar. Un ejemplo es si a la función printf de C de pasamos dos argumentos, tendremos que sumar al registro ESP 8 bytes, ya que cada argumento ocupa 4 bytes.
Y bueno, sobre este tema decir poco más, creo que es suficiente para entender el concepto.
EL JUEGO DE INSTRUCCIONES.
MOV Mueve datos entre variables y registros, unos ejemplos de su uso:
Código
mov eax, edx ; Mueve el contenido del registro EDX al registro EAX mov [mivariable], eax ; mueve el contenido de EAX a la variable "mivariable"
No se permiten mover datos entre variables, con lo cual
Código
mov [mivariable], [otravariable]
no es valido, para hacer eso tendríamos que mover el valor de "otravariable" a un registro y luego mover el registro a "mivariable".
NOTA: con el caracter ";" se ponen comentarios en el código
NOTA 2: los corchetes [] indican que lo que queremos es acceder al valor de la variable, no al puntero.
ADD con esta intruccion se realizan operaciones de suma, ejemplos de uso:
Código
add eax, 10 ; se suma al valor que contenga EAX 10. add [mivariable], 5; se le suma al valor de la variable 10
Código
al igual que ADD suma, SUB resta, su uso es igual.
SUB
INC incrementa el valor de la variable o registro en 1, ejemplos:
Código
inc eax ; incrementa el valor de EAX en 1 inc [mivariable] ; incrementa el valor de mivariable en 1
DEC decrementa el valor, su uso es similar a inc.
MUL instrucción para multiplicar, esta instrución funciona de la siguiente manera:
Código
mov [mivariable], 2 mov eax, 2 mul [mivariable] ; Multiplica 2*2. ; resultado en el registro EAX y EDX
NOTA: el registro EDX debe valer 0 a la hora de multiplicar.
DIV instrucción que se usa para dividir, funciona de la sigueinte manera:
Código
mov [var], 2 mov eax, 10 div [var] ; EAX = resultado ; EDX = residuo
EDX tiene que valer 0 antes de realizar la operación.
push introduce un valor en la pila.
Código
push eax push [mivar]
pop saca un valor de la pila.
pop eax ; el valor que contenia la pila ahora lo tiene EAX
pop [mivar] ; el valor que contenia la pila ahora lo tiene mivar
jmp salto hacia una parte del código, ejemplo:
Código
mov eax, 1 jmp Etiqueta ; saltamos mov eax, 2 ; esto no se ejecuta Etiqueta: ; EAX = 1
ret retorna una función, como return en C.
Código
... ... add esp, 12 ret
cmp esta instrucción compara dos valores es el if del ASM, para usarla se necesitan otras intrucciones complementarias, estas son algunas:
je salta a a una etiqueta si los valores son iguales
jne salta a una etiqueta si los valores NO son iguales
Entre otras, que podemos ver aquí:
Código:
http://www.jegerlehner.ch/intel/IntelCodeTable.pdf
Ejemplo de uso:
Código
cmp eax, edx je Iguales mov eax,0 ret Iguales: mov eax,1 ret
Si los valores son iguales devolvera 1, si no, devolvera 0.
xor realiza un xor, como en cualquier otro lenguaje, ejemplo.
Código
xor eax, edx
el resultado de la operación se guarda en el primer parametro de la instrucción, en este caso EAX
and operación aritmética, ej:
Código
and ebx, ecx
El resultado se obtiene tambien en el primer parametro, en este caso EBX
or operación aritmética, se usa igual que las dos anteriores.
ESTRUCTURA DEL CÓDIGO.
Una vez explicadas las intrucciones básicas vamos a explicar la estructura de los códigos en FASM.
Dejar claro que en ASM no es recomendable, no se puede (se puede pero no se debé) mezclar las variables con el código. La estructura es extrícta. Para generar un ejecutable podemos usar las siguientes estructuras:
Código
include 'win32ax.inc' .data ; AQUI VAN LAS VARIABLES .code start: ; AQUI EL CODIGO ; AL FINALIZAR EL CODIGO PODEMOS DECLARAR MAS VARIABLES. .end start
Ó de esta otra forma:
Código
include 'win32ax.inc' entry start section '.data' readable writeable ; AQUI VAN LAS VARIABLES section '.code' executable readable writeable start: ; AQUI EL CODIGO ; AL FINALIZAR EL CODIGO PODEMOS DECLARAR MAS VARIABLES. section '.idata' import data readable writeable ; AQUI VAN LAS IMPORTACIONES DE LAS FUNCIONES QUE VAMOS A USAR.
Un ejemplo de un programa que muestra un mensaje con MessageBoxA.
Código
include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC. entry start section '.data' readable writeable ; sección de datos Mensaje db 'Hola dese FASM!',0 ; debemos poner el byte nulo '0', para que sea una cadena. section '.code' executable readable writeable ; sección de codigo start: push 0 ; metemos el último parametro de la api push Titulo ; metemos el 3 parametro push Mensaje ; metemos el 2 parametro push 0 ; metemos el 1 parametro call [MessageBoxA] ; llamamos a la API. ret ; retornamos la funcion. Se acbaa el programa. Titulo db 'ElHacker.net',0 section '.idata' import data readable writeable ; tabla de importaciones library USER32, 'USER32.DLL' ; librería donde se encuentra la API import USER32,\ MessageBoxA, 'MessageBoxA' ; Función que vamos a usar
Resultado:
Como podemos observar, para llamar a una función hay que introducir los parametros en la pila, estos parametros deben ir al revez, ya que la pila en una estructura de tipo LIFO.
Código:
https://es.wikipedia.org/wiki/Last_in,_first_out
Ahora imaginemonos que queremos realizar una suma y mostrar el resultado en el mensaje.
Tenemos estad dos variables:
Código
Num1 dd 2 Num2 dd 3
Lo mas fácil es hacer esto:
Código
mov eax, [Num1] add eax, [Num2] push 0 push 0 push eax push 0 call [MessageBoxA]
Sin embargo, si probamos vamos a ver que no funciona... esto se debe a que un número no es lo mismo que una cadena. En lenguajes de de alto nivel si que funcionaría, porque el compilador/interprete realiza este paso por tí.
Para poder imprimirlo deberíamos de pasarlo a cadena, bién con una funcion que implementemos nosotros ó usando algúna del sistema como por ejemplo wsprintfA.
Bueno, esto es solo un apunte puntual, sigamos...
CONOCIENDO MEJOR LOS REGISTROS: BYTES, WORD y DWORD.
Cuando explique los registros no lo dije, pero los registros de proposito general se pueden descomponer a su vez en registros de menor tamaño.
Ya sabemos que al programar para 32 bits los registros ocupan 4 bytes, pero también podemos usar los registros de 16 y 8 bits...
Por ejemplo, el registro EAX es la extension de AX, que es el registro de 16 bits y este otro se divide a su vez en dos registros de 1 byte, AH (que esta en la parte alta) y AL (que esta en la parte baja)
Además podemos acceder a cualquier byte, word o dword de la siguiente forma:
Para obtener un byte de una variable o registro:
Código
; Suponiendo que en la variable buffer tenemos la cadena 'hola' mov al, byte[buffer] ; AL = 'h' mov ah, byte[buffer+1] ; AH = 'o' mov al, byte[ecx] ; mueve el byte al que apunta ECX a AL.
Lo mismo pasa con los WORD:
Código
mov DX, word[buffer]
Y los DWORD:
Código
mov eax, DWORD[buffer] mov eax, [buffer] ; esto es igual a la linea anterior
BUCLES y IF.
En ASM, no existen bucles for, while ni nada por el estilo, los bucles se hacen con contadores.
Por ejemplo un bucle infinito sería esto:
Código
Bucle: push 0 ; estamos dentro del bucle. push 0 push 0 push 0 call [MessageBoxA] jmp Bucle ; saltamos a la etiqueta bucle de nuevo.
Para intentar hacer un bucle for que se ejecuta 5 veces tendríamos que hacer esto:
Código
include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC. .data var dd 5 Texto db 'Esto se mostrara 5 veces.',0 .code start: mov ecx, [var] ; movemos el valor de la variable a ECX Bucle: push ecx ; guardamos el valor de ECX push 0 push 0 push Texto push 0 call [MessageBoxA] ; llamamos a la API pop ecx ; Recuperamos el valor de ECX dec ecx ; decrementamos el valor de ECX cmp ecx, 0 ; Comparamos ECX con 0 jne Bucle ; Si la comparación no es igual saltamos de nuevo a la etiqueta bucle ret ; retornamos la funcion y terminamos el programa. .end start
Pero... Porque guardamos el registro ECX antes de llamar a la API?
Resputa: Nomalmente TODAS las funciones de windows devuelven su valor en el registro EAX y solo modifican este registro despues de llamar a la función, pero en este caso la API MessageBoxA también modifica ECX, con lo cual en ECX ya no tendríamos nuestro contador por eso el push y pop con ECX, para guardar su valor y despues recuperarlo intacto.
Para hacer un IF en ASM tendríamos que usar la intrucción CMP, ya se ha mostrado su uso.
FUNCIONES
Para crear una función tenemos que recordar que los parametros se pasan a traves de la pila.
Lo primero para escribir el código de nuestra función es escribir una etiqueta y usar los registros ESP y EBP para acceder los parametros que hemos introducido anteriormente en la pila.
Ej:
Código
include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC. .data var dd 5 Texto db 'Este mensaje se ejecuta desde la funcion',0 Titulo db 'ElHacker.net',0 .code start: push Texto push Titulo call Mensaje ret Mensaje: ; Funcion mensage. push ebp ; Guardamos la base de la pila mov ebp, esp ; movemos la parte alta de la pila a la parte baja. mov eax, dword[ebp+8] ; movemos el primer parametro a EAX mov ebx, dword[ebp+12] ; segundo parametro a EBX push 0 ; introducimos los parametros d ela API push eax push ebx push 0 call [MessageBoxA] ; llamamos a la API pop ebp ; restauramos el valor de EBP add esp,12 ; se restaura el registro para que no se rompa la pila ret .end start
Para entender mejor el código antes de nada diré que la intrucción CALL lo que hace es introducir el valor de retorno en la pila, osea la siguiente intrucción del call para que luego el SO sepa a donde debé saltar al retornar la función.
Debido a esto para restaurar la pila hay que sumar 12 y no 8.
Código
add esp,12
Ya que son 2 parametros: 2 x 4 bytes que ocupan los punteros = 8
8 + 4 del valor de retorno cuando acabe la API = 12.
Si pasaramos 4 parametros seria 4 x 4 = 16
16 + el retorno = 20, tendriamos que sumar 20 a ESP.
Código
mov eax, dword[ebp+8] ; movemos el primer parametro a EAX mov ebx, dword[ebp+12] ; segundo parametro a EBX
Aquí, ocurre lo mismo por la dirección de retorno, el primer parametro se encuentra a la posicion 8 el segundo en la 12 y si metieramos mas parametros se encontrarián sumando de 4 en 4 osea:
dword[ebp+16] ; tercer parametro
dword[ebp+20] ; cuarto parametro
....
....
En fin, así funciona la cosa de las funciones, cualquier duda preguntar.
OllyDbg y la depuración de nuestro programa.
La aplicación la podemos descargar gratuitamente desde aquí:
http://www.ollydbg.de/download.htm
Una vez descargada la ejecutamos y vamos a File > Open y abrimos cualquier ejecutable.
Una vez hecho esto el Olly nos deja situados en el EntryPoint del programa es decir, la primera instrucción que se ejecuta del programa.
La utilización de esta herramienta para depuración es simple porque nosotros conocemos como esta programado nuestro ejecutable pero para depurar programas que no hemos creado nosotros puede resultas lioso y complicado, no obstante como nosotros solo queremos depurar y ver como funciona no nos resultará complicado.
Ahora bién, veamos sus partes:
En el punto 1: Vemos las instrucciónes del programa, los opcodes de la instrucción y la dirección en memoria, ejemplo:
Código:
0040102A |. 09C0 OR EAX,EAX
0040102A -> Es la posición en memoria.
09C0 -> Opcodes de la instrucción
OR EAX,EAX -> instrucción
Punto 2: vemos los valores de los registros. Los valores del registro iran cambiando conforme vamos ejecutando instrucciones (siempre y cuando la instrucción modifique algun registro, si no se quedan como estaban)
Punto 3: El ejecutable dumpeado.
Punto 4: La pila, en el veremos los datos que se introducen en la pila y el valo rque contiene.
AHora bién veremos como se maneja el programa, para ello vamos a ensamblar un ejemplo que pusimos anteriormente:
Código
include 'win32ax.inc' ; incluimos la librería para podes usar las macros SECTION, LIBRARY y ETC. .data var dd 5 Texto db 'Esto se mostrara 5 veces.',0 .code start: mov ecx, [var] ; movemos el valor de la variable a ECX Bucle: push ecx ; guardamos el valor de ECX push 0 push 0 push Texto push 0 call [MessageBoxA] ; llamamos a la API pop ecx ; Recuperamos el valor de ECX dec ecx ; decrementamos el valor de ECX cmp ecx, 0 ; Comparamos ECX con 0 jne Bucle ; Si la comparación no es igual saltamos de nuevo a la etiqueta bucle ret ; retornamos la funcion y terminamos el programa. .end start
Lo ensamblamos y lo cargamos en el olly. Como es un programa pequeñito vamos a ver poca cosa , el ASM que vemos es este:
Bién, ahora vamos a ver como depurarlo:
-Si pulsamos F9, nuestro programa correra fluidamente, es decir, como si lo estuvieramos ejecutando.
-Si pulsamos F8 vamos a ejecutar una sola instrucción.
- Si pulsamos F7 se va a ejecutar una intruccion como en F8 pero con la diferencia de que si lo pulsamos sobre una instrucción CALL entraremos en la función (con F8 esto no sucede).
-Si pulsamos F2 pondremos un BreakPoint en la instruccion que tenemos selecionada. Es decir, si ponemos un BP y pulsamos F9 el programa se ejecutara hasta llegar a la instrucción a la que le pusimos en BP (BreackPoint).
Para comprobar el funcionamiento podemos ir probando por ejemplo si ponemos un BP en esta linea:
Código
0040201D |.^75 E7 \JNZ SHORT Tutorial.00402006
Y pulsamos F9, el programa se nos parara ahí, si lo volvemos a pulsar se nos volvera a parar, así hasta 5 veces, que son las veces que se ejecuta esa instrucción ( recordemos que es un bucle).
Vamos a probar mas cosas. En el programa vemos que guardamos ECX, pero... porque?
Bien si quitamos el push ecx y pop ecx del programa lo ensamblamos y abrimos con Olly lo vamos a ver:
Tenemos eso en el Olly y ahora vamos a ir ejecutando instrucción a instrucción pulsando F8. Pulsamos F8 hasta llegar a la llamada a MessageBox, aquí:
Código
00402011 |. FF15 3C304000 |CALL DWORD PTR DS:[<&USER32.MessageBoxA>; \MessageBoxA
Entonces miramos el valor del registro ECX:
Si pulsamos una vez mas F8 vamos a ver que el valor de ECX cambia y el bucle se va a romper... el programa estallara, por eso lo de guardar el valor de ECX.
Con esto quería mostrar que a veces las llamadas a las API pueden modificar los registros y nos pueden volver loco buscando el error si no andamos con cuidado.
En fin, con este poquito que hemos visto de OllyDbg podemos depurar nuestro programa, Si quereis indagar mas sobre este Software teneis miles de tutoriales en la web de Ricardo Narvaja:
www.ricardonarvaja.info
Creo que con esto acabo de tutorial de momento ya que creo que se puede tener una visión general de lo que va el tema.
un saludo y espero que ha alguien le haya ayudado!