¿Qué ha pasado?
Le has dado unas directrices a C en tu construcción del mapa de bits y ha intentado acomodarlo como ha podido.
¿Cómo lo ha acomodado?
Vamos a reducir el programa a la mínima expresión:
#include <stdio.h>
struct s_producto {
unsigned char codigo : 4;
unsigned short cantidad: 9;
unsigned char procedencia: 1;
unsigned char bas: 2;
};
union u_producto {
struct s_producto producto;
unsigned short int empaquetado;
};
int main() {
union u_producto vec = {0};
printf("tamanno del mapa de bits: %lu bytes\n\n", sizeof(vec.
producto));
vec.producto.codigo = 0xF;
printf("codigo : %08X\n", vec.
empaquetado);
vec.producto.procedencia = 0x1;
printf("procedencia: %08X\n", vec.
empaquetado);
vec.producto.cantidad = 0X1FF;
printf("cantidad : %08X\n", vec.
empaquetado);
vec.producto.bas = 0x3;
printf("basura : %08X\n", vec.
empaquetado); }
Resultado:
tamanno del mapa de bits: 6 bytes
codigo : 0000000F
procedencia: 0000000F
cantidad : 0000000F
basura : 0000000F
Sólo veo código. Vamos a abrir el rango.
En vez de
union u_producto {
struct s_producto producto;
unsigned short int empaquetado;
};
ponemos
union u_producto {
struct s_producto producto;
unsigned int empaquetado;
};
y resulta en
tamanno del mapa de bits: 6 bytes
codigo : 0000000F
procedencia: 0000000F
cantidad : 01FF000F
basura : 01FF000F
Podemos ver que alineó codigo en 2 bytes (aunque solo tuviera 4 bits) y cantidad también la ha alineado en otros dos bytes. Ya te digo también que he estado buscando procedencia y basura y no los he encontrado, pero están ahí. En el mejor de los casos está usando un byte en otro sitio para guardar esa información.
Por otra parte ocurre una cosa muy interesante. Si juntamos todos los unsigned char dentro del mapa de bits la cosa cambia:
struct s_producto {
unsigned short cantidad: 9;
unsigned char codigo : 4;
unsigned char procedencia: 1;
unsigned char bas: 2;
};
El resultado es el siguiente:
tamanno del mapa de bits: 4 bytes
codigo : 000F0000
procedencia: 001F0000
cantidad : 001F01FF
basura : 007F01FF
Vamos a exprimir un poco más el mapa de bits. ¿Qué pasaría si hubieras usado unsigned short en todos los tipos de datos dentro del mapa?
struct s_producto {
unsigned short cantidad: 9;
unsigned short codigo : 4;
unsigned short procedencia: 1;
unsigned short bas: 2;
};
Esto da como resultado:
tamanno del mapa de bits: 2 bytes
codigo : 00001E00
procedencia: 00003E00
cantidad : 00003FFF
basura : 0000FFFF
De hecho te recomiendo quitar bas, porque no se usa.
En estructuras más complicadas sí que se usan bits para alinear la estructura interna, y solo tienen ese propósito, y estos son anónimos, no tienen nombre. Por ejemplo:
struct mapa_bits {
unsigned dato: 3;
unsigned: 4; // hueco de 4 bits sin nombre
unsigned dato_2: 7;
}
Como dato curioso también existen los anónimos de 0 bits. Estos lo que le indican al compilador es que alinee los campos de bits que le siguen a una potencia de dos. De nuevo todo esto es para facilitar al procesador el movimiento de datos en la memoria.
Por ejemplo:
struct s_producto {
unsigned short cantidad: 9;
unsigned short: 0;
unsigned short codigo : 4;
unsigned short procedencia: 1;
};
Me devuelve el siguiente resultado:
tamanno del mapa de bits: 4 bytes
codigo : 000F0000
procedencia: 001F0000
cantidad : 001F01FF
¿Qué quiere decir todo esto?
No es buena idea usar union de esta forma, es decir, para empaquetar estructuras. Ya has visto que el compilador hace lo que quiere con ellas.
Más adelante te encontrarás que incluso guardar una estructura entera en disco o mandarla por la red te dará problemas porque al rescatarla leerás basura. Esto es debido, otra vez, a que el compilador hace lo que quiere con las estructuras y si a ti te las ha colocado de una forma en memoria, a otro puede que tenga sus miembros de forma diferente y por lo tanto se colocarán mal los datos. Pero también puede que en las dos máquinas las estructuras esté construidas igual y consigas bien la información.
Esto quiere decir que para serializar y deserializar estructuras manda al stream cada miembro de la estructura, uno a uno, en una secuencia dada. Recupera del stream uno a uno los miembros de la estructura en el mismo orden que los enviaste.
Por último, y como ya te habrás dado cuenta, dar diferentes tipos de datos a los miembros de un mapa de bits hace que el compilador intente agruparlos por tipo. Mezclarlos, como has visto, resulta en un desastre. Te recomendaría que uses
unsigned y el compilador te lo va a acomodar todo en 32 bits.
Si necesitas un control muy fino de bits en memoria deberías pensar en operaciones de desplazamiento de bits junto a operaciones lógicas. Los mapas de bits son más para no gastar mucha memoria en números pequeños y caso es buen ejemplo de ellos. Un dato que perfectamente cabe en 4 bits, otro que cabe en 9 y otro que cabe en 1, puedes meterlo todo en 2 bytes en vez de gastar 12, que sería si los hubieras declarado como tres enteros diferentes.
Los campos de bits se ven mucho más en sistemas embebidos y microcontroladores.