Foro de elhacker.net

Programación => Programación C/C++ => Mensaje iniciado por: mcMario en 12 Diciembre 2016, 02:40 am



Título: leer un documento HTML,cada etiqueta debe guardarse en un nodo de un árbol
Publicado por: mcMario en 12 Diciembre 2016, 02:40 am
Me dejaron un trabajo que me parece un tanto complicado. Necesito conocimiento en varias cosas por lo que es algo complejo. El programa debe de leer un documento HTML. Después cada etiqueta del HTML debe guardarse en un nodo de un árbol, cada hijo del árbol debe ser una etiqueta inferior del HTML. De momento he logrado solamente leer una etiqueta, al momento de intentar guardar en un nodo me marca "Violación de segmento" (Como referencia uso ubuntu). Espero haberme explicado y espero que me responda alguien. Dejare la parte de código que tengo bien.

Código
  1. #include "arbol.h"
  2.  
  3. void main(){
  4.  
  5. FILE* archivo = fopen("arbol.html","r");
  6. int c, i;
  7. //char c;
  8. char * buffer = NULL;
  9. Arbol arbol;
  10. arbol = arbol_crearArbol();
  11. Nodo n;
  12.  
  13. c = fgetc(archivo);
  14.  
  15. if(c == '<'){
  16. c = fgetc(archivo);
  17. buffer = (char*)realloc(NULL, sizeof(char));
  18.    i = 0;
  19.    while( c != '>') {
  20.       buffer[i] = c;
  21.       i++;
  22.       buffer = (char*)realloc(buffer, (i+1)*sizeof(char));
  23.       c = fgetc(archivo);
  24.       n = arbol_crearNodo(buffer);
  25.       if(arbol.raiz == NULL){
  26.       arbol.raiz = &n;
  27.       }
  28.       else{
  29.       Nodo* aux = arbol.raiz;
  30.       if(aux->hijo == NULL){
  31.       n.hijo = &n;
  32.       }
  33.       else{
  34.       aux = aux->hijo;
  35.       }
  36.  
  37.       }
  38.    }
  39.       printf("%s\n", buffer); //La etiqueta queda guardada en buffer
  40. }
  41. }
  42.  
  43.  
  44. ///////////////////////////////////////////////////////////////////////////////////////////
  45. /*Este es el arbol.h que hice*/
  46.  
  47. #include <stdio.h>
  48. #include <stdlib.h>
  49. #include <string.h>
  50.  
  51. typedef struct MiNodo{
  52. char* dato;
  53. struct MiNodo* hijo;
  54. }Nodo;
  55.  
  56. typedef struct{
  57. Nodo* raiz;
  58. }Arbol;
  59.  
  60. Nodo arbol_crearNodo(char* dato){
  61. Nodo n;
  62. n.dato = dato;
  63. n.hijo = malloc(sizeof(Nodo));
  64. n.hijo = NULL;
  65.  
  66. return n;
  67. }
  68.  
  69. Arbol arbol_crearArbol(){
  70. Arbol a;
  71. a.raiz = malloc(sizeof(Nodo*));
  72. a.raiz = NULL;
  73.  
  74. return a;
  75. }
  76.  
  77. void arbol_imprimir(Nodo n){
  78. printf("%s\t", n.dato);
  79. }
  80.  
  81. void arbol_imprimirPreorden(Nodo *n){
  82. //raiz-izq-der
  83. if( n != NULL){
  84. arbol_imprimir(*n);
  85. arbol_imprimirPreorden(n->hijo);
  86. }
  87. }


Mod: Los códigos deben ir en etiquetas GeSHi, los titulos deben ser descriptivos al problema