Pues mi problema es este: tengo mi copia de Facebook, el cual vino en formato HTML y pesa 5 gb. y en las charlas quiero buscar una palabra concreta. El problema es que para cada charla hay una carpeta donde se aloja un archivo HTML. ¿Cómo elijo una carpeta, abro el HTML, busco la palabra, si no se encuentra la palabra, voy a la siguiente carpeta y realizo el mismo procedimiento, así hasta encontrar la charla donde esta esa palabra(sin darme cuenta acá me estaba dando solo el algoritmo) Respuesta: para mi mismo abajo te pongo el código, no es muy bonito y debería refinarlo un poco mas, pero funciona
# -*- coding: utf-8 -*-
"""
Created on Tue May 31 10:57:13 2022
@author: Administrador
"""
from pathlib import Path
import codecs
palabra_elegida = "Paula"
pathlist = Path(r"C:\Users\Administrador\Downloads\face\facebook-nor1").glob('**/*.html')
for path in pathlist:
file = codecs.open(path, "r", "utf-8")
for linea in file:
for palabra in linea.split():
if palabra==palabra_elegida:
print(path)