Ni machine learnig ni leches eso es comparación de patrones, puede usarse para cualquier cosa, sonido o valores concretos. La comparación busca una aproximación probabilística. Yo por lo menos tengo experiencia de ello y lo hice para mi, para detectar matrículas de coches y leer la matrícula.
Para comparación de imágenes, en blanco y negro, reduce la calidad y vete pixelando los patrones. Cuanto más pixelado menos precisión en la comparación que podría interpretarse como "menos parecido", porque un parecido similar en un 90% sería aquel que coincida si se superposicionara el patrón con el modelo a buscar. Basicamente es eso, superposicionar el modelo con los patrones (en plural) y buscar el patrón que mejor coincida. En biometría se hace lo mismo.
Por ejemplo para el tema de las matrículas tuve que introducir todos los posibles patrones y eso se traduce en guardar todo el alfabeto y los números con la fuente de letra que usan las matrículas. Entonces el algoritmo va detectando las letras o los números recorriendo la fila ya que las matrículas por lo general tienen una o dos filas y siguen unas reglas, antiguamente primero dos letras luego números y luego letras o con matrículas nuevas que van con números y luego tres letras, aunque algunas llevan al comienzo la letra de donde proviene el vehículo.
Las redes neuronales o sistemas de aprendizaje son para complementarlos con estos sistemas con el fin de mejorar la detección. Por ejemplo, si hago un programa de reconocimiento de voz me conviene implementar un sistema de aprendizaje para la aplicación porque por lo general lo usará el mismo usuario donde esté instalada, porque no todo el mundo pronuncia igual. De esa forma consigo que la aplicación le cueste menos entender al usuario y evito que el usuario tenga que hablarle a la aplicación en un castellano perfecto bien pronunciado.
Hay que ver menos películas y ponerse a experimentar,
Sobre imagen, conocimientos en filtros :
https://en.wikipedia.org/wiki/Edge_detectionhttps://en.wikipedia.org/wiki/Color_quantizationMás teoría :
https://en.wikipedia.org/wiki/Pattern_recognition