exacto.
vas a audio capture.
para mejor resultado por el tema de la velocidad de conexión que tiene la victima te rekomiendo una baja kalidad de sonido, komo por ejemplo
11025 khz MONO 8-bit
pones autoplay recived streams
y pones automatically save and remove streams..
y le das start...
tenes que fijarte que la victima tenga microfono si no e te va a komplikar un pokito

fijate arriba de todo en la parte de audio capture que dice los dispositivos de mic que tiene.
espero te sirva, bye