Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: rulogarcillan en 16 Enero 2015, 18:01 pm



Título: Eliminar caracteres no alphanumericos excepto algunos
Publicado por: rulogarcillan en 16 Enero 2015, 18:01 pm
Muy buenas lo primero es presentarme, un saludo a toda la gente. Estoy empezando con python y no me conozco apenas los modulos basicos a si que ando perdido cn esto.

Tengo una cadena de texto la cual quiero eliminar caracteres basura, extraños como cuadraditos, y simblos raros.
Código
  1. import re
  2.  
  3. cadena = re.sub('[^0-9a-zA-Z]+', '', cadena)

Con esto me lo hace pero me quita @, comas, puntos / y esos si me gustaría mantenerlos....

Alguna solución sencilla?

gracias de antebrazo


Título: Re: Eliminar caracteres no alphanumericos excepto algunos
Publicado por: rulogarcillan en 16 Enero 2015, 18:56 pm
Muy novato lo mio joder

Código
  1. textoO = re.sub('[^0-9a-zA-Z\/@+\-:,|#]+', '', textoO)


Título: Re: Eliminar caracteres no alphanumericos excepto algunos
Publicado por: Eleкtro en 16 Enero 2015, 20:23 pm
Hola

( ¿porque utilizas el botón de citar?, tienes un botón para insertar código. )

Lo que necesitas aprender es más bien la utilización y el comportamiento de las expresiones regulares (RegEx), en Python.

La expresión que has mostrado se puede simplificar:
Código
  1. textoO = re.sub('[^\w\/@+\-:,|#]+', '', textoO)

Saludos