Amigo, amigo.. no es apra que te enojes...
Me he redactado todo de nuevo y aqui te lo digo:
Introduccion:
Imaginate que tengo la carpeta: C:/ARCHIVOS y en ella hay 50.000 archivos .txt con MUCHO texto tentro
Desde mi web, (PHP) ingresando otro .txt en un formulario, analizaré si hay un archivo "parecido" al ingresado en mi carpeta C:/ARCHIVOS..
El archivo ingresado, se considera "parecido" si: Es totalmente igual, o hasta en un 70% (ésto es lo que produce el problema)
Dato:
El algoritmo de INDEXADO a la base de datos de los archivo de la carpeta, consiste en tomar 10 muestras de 5 "caracteres" de los archivos de C:/ARCHIVOS y guardarlos consecutivamente como 1 sola gran palabra...
O sea: Con un motor, voy a entrar a cada uno de los archivos y voy a tomar ese muestreo y guardarlo en la base de datos a esa gran palabra que me quedó..
La palabra será de 50 caracteres, proque son 10 muestras de 5 Caracteres..
Web:
Desde la web se ingresa X archivo y se le toma el mismo muestreo...
Opciones:
En la base de datos puedo guardar las muestras de varias formas.. por ejemplo con separadores o sin..
Con separadores: 12345;34567;98654;98764 (y así hasta llegar a las 10 muestras)
O sin separadores: 1234567898765432 (y así hasta llegar a las 10 muestras)
Lo que tengo que hacer:
Con la muestra que tengo del archivo ingresado, tengo que COMPRAR los tramos...
O sea.. agarro los primeros 5 caracteres de la muestra del arcchivo ingresado, y los comparo con los 5 primeros caracteres de la 1º entrada de la base de datos.. en caso de ser TOTALMENTE IGUALES, "suma 1 punto", despues compara los otros 5.. y así... al finalizar el escanero de la primer entrada de la base de datos, me va a decir: "Tenemos 8 tramos iguales", por lo tanto, este archivo supera el 70% establecido de "comparacion", y se considera que el archivo ingresado y la 1º entrada de la base de datos son IGUALES o PARECIDOS.. y por lo tanto, tengo que "devolver" esa entrada con MYSQL..
Despues sigue comparando toda la base de datos y me tiene que devolver normalmente (como siempre lo ahce) el array con las entradas que son "aceptadas" por éste algoritmo...
La pregunta:
¿Como hago eso?
Es como que, necesito una CONSULTA SUPER LOGICA...
Tengo 3 opciones:
*Que realmente exista una manera de darle esa logica en la entrada SQL y me quedo feliz..
*Que no exista esa manera de darle logica a SQL y por lo tanto tengo que "recuperar" todas las lineas de la base de datos y compararlas con un algorirmo normal de PHP
*Ponerme a hacer una base de datos que soporte ese sistema de LOGICA y llenarme muy de guita...