Si te refieres a eliminar el código interno, el Html, para dejar solamente el texto asignado en los atributos, campos o tags, tan solo tienes que utilizar la propiedad
InnerText del tipo
HtmlElement.
Tomando este documento html de ejemplo:
<!DOCTYPE html>
Lo cargamos en una nueva instancia del tipo
WebBrowser y...
string html = File.ReadAllText("C:\\Document.htm");
using (WebBrowser wb
= new WebBrowser
()) { wb.ScriptErrorsSuppressed = true;
wb.DocumentText = html;
wb.Document.OpenNew(replaceInHistory: true);
wb.Document.Write(html);
wb.Refresh();
Console.Write(wb.Document.GetElementsByTagName("HTML")[0].InnerText);
}
Resultado de ejecución:
My Title
My Heading
My paragraph
PD: Este ejemplo es con un archivo local, pero puedes hacer lo mismo descargando una página online, por supuesto.
¡Saludos!