elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado:


+  Foro de elhacker.net
|-+  Programación
| |-+  Scripting
| | |-+  [Python] Leer archivo HTML ?
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: [Python] Leer archivo HTML ?  (Leído 6,880 veces)
emma93

Desconectado Desconectado

Mensajes: 33


Ver Perfil
[Python] Leer archivo HTML ?
« en: 1 Octubre 2010, 04:58 am »

Que tal queridos amigos.
Me ha surgido una duda y que mejor que venir a preguntarle a la gente que realmente sabe :)

Me estoy iniciando en python, y tengo un mini proyecto en mente (esas ideas que se pasan por la cabeza y que siempre surge la curiosidad de realizarlas) y para cumplirlo necesito PODER SABER como leer un archivo html e imprimir sus lineas. (En realidad no es imprimir sus lineas sino modificarlas, pero un ejemplo de imprimir las lineas me vendría bárbaro).

He intentado de la siguiente manera:

Código
  1. archivo = open('archivo.html',"r")
  2.  
  3. for lineas in archivo.readlines() :
  4. print lineas
  5.  
  6. archivo.close()

Ejecuto y al momento de imprimir las lineas me sale lo siguiente :



Como que los carácteres no logran decodificarse, como si tuviesen un formato diferente, o algo por el estilo. Alguien me podría ayudar ?

Muchas gracias !


En línea

criskapunk

Desconectado Desconectado

Mensajes: 277



Ver Perfil
Re: [Python] Leer archivo HTML ?
« Respuesta #1 en: 1 Octubre 2010, 13:32 pm »

Buenas,

Para imprimir las lineas, este codigo me funciono (Tambien estoy aprendiendo python ;D)

Código
  1. archivo = open("nombreDelArchivo.html")
  2. texto = archivo.read()
  3. print texto

Un saludo ;)


En línea

emma93

Desconectado Desconectado

Mensajes: 33


Ver Perfil
Re: [Python] Leer archivo HTML ?
« Respuesta #2 en: 2 Octubre 2010, 05:08 am »

Amigo el problema era que los archivos que intentaba abrir eran los historiales de conversación del messenger plus.

Pero resulta que estos tenían una codificación diferente llamada 'UTF-16LE' (algo así).

Resulta que la solución fue:
Código
  1. archivo = open('conversacion.html','r')
  2. print archivo.read().decode('utf-16le')
  3. archivo.close()

de esa era la unica manera que los lograba leer, un saludo amigo !
En línea

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

Mensajes similares
Asunto Iniciado por Respuestas Vistas Último mensaje
[Leer] Papel de Python en Google [Interesante]
Scripting
@Sthéfano 0 4,448 Último mensaje 26 Julio 2011, 02:50 am
por @Sthéfano
leer archivo con python
Scripting
poeta3d 1 3,524 Último mensaje 18 Diciembre 2011, 04:53 am
por 0x5d
[Python] Error leer archivo
Scripting
Arnau27 4 5,489 Último mensaje 1 Mayo 2012, 11:39 am
por 0x5d
Error al querer leer el último registro en archivo .txt [python] « 1 2 »
Scripting
DanielPy 16 8,756 Último mensaje 31 Marzo 2018, 08:38 am
por Avispon99
¿CMD, PowerShell, Python es capaz de leer un archivo.dll de C++ nativo?
Scripting
Meta 0 2,245 Último mensaje 20 Junio 2020, 02:41 am
por Meta
WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines