Hola chicos verán quiero hacer un proyecto el cual identifique secuencias de palabras de un documento y verifique si estas palabras se encuentran en otro documento (para poder ver si se trata de una copia o no), la idea es que trate de identificar secuencias grandes, que estructura de datos me recomendarían para poder realizar esto?, Saludos
PD: Yo había pensado utilizar un arbol heap, pero no se si sea la mejor opción.