Es decir que quiero al algoritmo original dividirlo en 4(es un ejemplo) y que cada nodo resuelva su parte y al final se forme un resultado. Porque estuve viendo que al ejecutar el programa envia instruccion por instruccion y se vuelve mas lenta la ejecución. ayudis porfis.

PD: Estoy usando MPI
