Lo mejor que puedes hacer es utilizar un buen editor de audio (SoundForge p.ej) y ir jugando con el rango de frecuencias en el que esté incluída la voz. Este rango puede variar dependiendo de la voz de la persona que cante, pero normalmente la voz humana suele estar comprendida entre 87-392 (fundamental) y entre 1-12 (sus armónicos).
Prueba a bajar con un buen ecualizador multibanda los niveles de este rango y aplica algo de compresión con algun soft de compresión (el compresor de la serie "Waves" es muy bueno) que te permitirá recuperar algunos de los sonidos de la misma frecuencia que se pierden al bajar los niveles.
Claro está que es una labor que no se puede hacer con un programa con un solo click y lo mejor es que lo hagas con tu oído y probando... Lo que te quede esta claro que no será perfecto y notarás perdidas en esas frecuencias... Pero se quedará maquillado. Yo te puedo decir que lo utilizo para esto y a la inversa, es decir, hay veces que solo me interesa la voz y hago lo contrario... todas las bandas abajo menos las de la voz.
Y si no te gusta como te queda pues te pillas el midi de la canción (lo que usan en los karaokes) y ya la tienes sin voz...
Espero que te sirva de algo... Un saludo