elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Usando Git para manipular el directorio de trabajo, el índice y commits (segunda parte)


+  Foro de elhacker.net
|-+  Programación
| |-+  Programación General
| | |-+  .NET (C#, VB.NET, ASP)
| | | |-+  Programación Visual Basic (Moderadores: LeandroA, seba123neo)
| | | | |-+  [aporte] MIME identificar archivos por su contenido
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: [aporte] MIME identificar archivos por su contenido  (Leído 8,810 veces)
Yoghurt

Desconectado Desconectado

Mensajes: 122


Si alguien se molesto en escribir, justo es leer.


Ver Perfil WWW
[aporte] MIME identificar archivos por su contenido
« en: 22 Septiembre 2011, 07:37 am »

Mas de alguno a querido saber el tipo de algun archivo como lo hacen los sistemas basados en UNIX basandose puramente en su contenido, pues he creado un modulo ocupando esa información para que nada se les escape, se llama MIME.

Descripción:
Módulo que intenta detectar el tipo de los archivos basandose en su contenido. Mediante los conocidos Magics. Contiene al menos 317 entradas que identifican archivos, incluyendo texto, musica, imagen, videos y otros.

Ej de que son los magics:
cangrejo_canguroo.pdf --> MAGIC = "%PDF-" --> MIME = "application/pdf" --> EXTENSION = "pdf"

Usos:
Tiene un montón de usos, desde saber si el archivo solicitado es realmente del tipo de archivo requerido, listar todos los archivos de un tipo por ejemplo MSWord, reconocer ejecutables camuflados, organizacion de archivos... etc.

>> Descargar <<
Desde Google Drive (Archivo->Descargar)

Estaré actualizando el codigo recurrentemente por lo que se aceptan sugerencias y mejoras, claro pueden ir diciendome sus propios magics para añadirlos a la lista o hacer peticiones sobre archivos.


« Última modificación: 31 Agosto 2012, 11:49 am por AbrahamAraon » En línea

Elemental Code


Desconectado Desconectado

Mensajes: 622


Im beyond the system


Ver Perfil
Re: MIME identificar archivos por su contenido
« Respuesta #1 en: 23 Septiembre 2011, 03:09 am »

osea que yo le largo adentro un archivo sin extensión y me dice de que tipo es?
Si no no entendi :S

PD: habia leido en la esc, que todos los archivos en los primeros 3 caracteres decian que tipo de archivo eran o algo asi  :silbar:


En línea

I CODE FOR $$$
Programo por $$$
Hago tareas, trabajos para la facultad, lo que sea en VB6.0

Mis programas
raul338


Desconectado Desconectado

Mensajes: 2.633


La sonrisa es la mejor forma de afrontar las cosas


Ver Perfil WWW
Re: MIME identificar archivos por su contenido
« Respuesta #2 en: 23 Septiembre 2011, 03:14 am »

osea que yo le largo adentro un archivo sin extensión y me dice de que tipo es?
Si no no entendi :S
Exactamente, y si renombras un archivo mp3 a JPG, que te detecte que es un MP3 :P
En línea

raul338


Desconectado Desconectado

Mensajes: 2.633


La sonrisa es la mejor forma de afrontar las cosas


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #3 en: 17 Julio 2012, 13:00 pm »

Up por modificación
En línea

79137913


Desconectado Desconectado

Mensajes: 1.169


4 Esquinas


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #4 en: 17 Julio 2012, 13:58 pm »

HOLA!!!

En su momento no quise comentar este tema por que es viejo pero ya que lo bumpearon...

Tiene estos detalles:
Reconoce a los docx xlsx y demas formatos nuevos de office como un zip (realmente lo son) pero son documentos de office mas que un comprimido.
No reconoce .txt o .text.

Pero tengo que reconocer que es util.

P.D:
Estaria bueno que detecte si el archivo fue "unido" a otro usando algo similar a copy /b por ejemplo cuando pones un jpg y un rar en el mismo archivo y le cambias la extension y funcionan ambos.

GRACIAS POR LEER!!!
En línea

"Como no se puede igualar a Dios, ya he decidido que hacer, ¡SUPERARLO!"
"La peor de las ignorancias es no saber corregirlas"

 79137913                          *Shadow Scouts Team*
Yoghurt

Desconectado Desconectado

Mensajes: 122


Si alguien se molesto en escribir, justo es leer.


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #5 en: 19 Julio 2012, 12:00 pm »

Actualizado MIME version 1.1, julio 18, 2012

 * Añadida la propiedad 'ext' en la declaracion de TYPE_MIME la cual
   contendra informacion sobre la extension del archivo en cuestion.
 * Adicion de informacion sobre extension.
 * Añadido el reconocimiento de archivos de texto plano entre otros.
 * Añadida la opcion de buffer para no tener que leer el archivo cada vez.
 * Modificacion para interpretar numeros negativos en 'offset_start' y
   'offset_end' interpretandose desde el final del archivo hacia el principio.
 * Añadida la funcion findMime que busca el Magic directamente desde un string.
 * Modificaciones y optimizaciones al codigo en general.
 * Eliminados los tipos de pattern ahora se usa uno solo (escaped strings)


He modificado el codigo de forma que sea más eficiente. Ademas he añadido el reconocimiento para los nuevos formatos de la suite de office (testeado con OpenOffice.org), los archivos de texto "plano" (.txt) tambien serán reconocidos. Por otra parte los archivos unidos mediante "copy /b file1.jpg + file2.rar" no seran reconocidos porque el file2.rar esta dentro del file1.jpg justamente desde donde el file1.jpg termina, por lo que el "magic" no cambia. Ahora, podria hacer un "parche" como lo hice para los ".txt" textos planos aunque no se si ayudaria el reconocer ese tipo de archivos...ademas de la insertidumbre de ponerle un nombre "mime" y una "extension".

El link de descarga será el mismo.
En línea

BlackZeroX
Wiki

Desconectado Desconectado

Mensajes: 3.158


I'Love...!¡.


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #6 en: 19 Julio 2012, 22:17 pm »

Es una gran lista la que tienes, aqui te dejo la pagina de los MIME TYPE.
http://www.iana.org/assignments/media-types/index.html

Dulces Lunas!¡.
« Última modificación: 19 Julio 2012, 23:17 pm por BlackZeroX (Astaroth) » En línea

The Dark Shadow is my passion.
karmany
Colaborador
***
Desconectado Desconectado

Mensajes: 1.614


Sueñas que sueñas


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #7 en: 21 Julio 2012, 09:32 am »

Buena aportación.

Dos cosas:
  • Sería interesante que añadieras el compilado o un demo para que podamos ser beta-testers
  • No sé si la tienes implementada, o tal vez lleve demasiado tiempo hacerlo, pero una buena opción podría ser la extracción de tipos de archivo. Muchos ficheros contienen otros embebidos.

Gracias por compartir.
En línea

Yoghurt

Desconectado Desconectado

Mensajes: 122


Si alguien se molesto en escribir, justo es leer.


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #8 en: 22 Julio 2012, 09:16 am »

  • Sería interesante que añadieras el compilado o un demo para que podamos ser beta-testers
Este codigo es para ser integrado en Visual Basic aunq podria hacer una beta para que sea probado, asi no tendríamos que desconfiar y servira para encontar errores pues no puedo probarlo con tantos archivos, asi que lo haré ;)

  • No sé si la tienes implementada, o tal vez lleve demasiado tiempo hacerlo, pero una buena opción podría ser la extracción de tipos de archivo. Muchos ficheros contienen otros embebidos.
Mmm... Si, me he encontrado con estos casos como los archivos de recursos de algun juego (o el .rar dentro de un .jpg). Tengo una "utilidad" para extraer de forma "rustica" por decirlo asi archivos que estan incrustados dentro de otro archivo con ayuda de este metodo. Lo hice para detectar y extraer PNG, GIF, JPG, BMP, AVI, WAV, MIDI, SWF, OGG, AU y MP3 con tag ID3. Le he puesto xtract y lo encuentras en: http://sdrv.ms/LG1BWQ
En línea

Yoghurt

Desconectado Desconectado

Mensajes: 122


Si alguien se molesto en escribir, justo es leer.


Ver Perfil WWW
Re: [aporte] MIME identificar archivos por su contenido
« Respuesta #9 en: 31 Agosto 2012, 12:25 pm »

Y listo... He subido un compilado sencillo para testear los archivos, he puesto 3 botones los cuales ayudarán a recolectar información valiosa sobre errores de acuerdo a si:

* No ha reconocido un archivo que es conocido por el programa o por la persona.
* Ha dado mala informacion sobre el tipo de archivo.
* Y si decean que se reconozca o incluya en el codigo algun archivo que deceen.


La información recopilada consta de los primeros 64 bits del archivo en cuestion (escrita en texto hexadecimal) para una revision acerca del problema/detalle o examen para detectar el archivo. La información no es enviada automaticamente solo es escrita en el archivo "info_plase_send_mail.info" junto a la aplicacion por lo que deberá adjuntar el archivo via e-mail. Para quienes decean contribuir favor de usar estos emails, dreaderfunkonak@gmail.com / abrahamaraon@hotmail.com de antemano gracias.


>> El enlaze de descarga es el mismo.
« Última modificación: 31 Agosto 2012, 12:29 pm por AbrahamAraon » En línea

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines