Dělam indexovacího robota, každá stránka má jiný kódování, tak ho potřebuju před uloženim převést na jednotný (třeba UTF-8..). Kódování stránky beru z meta tagu, případně z hlavičky, to neni problém.
Horší je už převod, pokaždý dostanu namísto diakritiky max. háčky. Zdroják vracim:
//......
response = (HttpWebResponse)request.GetResponse();
Stream responseStream = response.GetResponseStream();
//namísto true jsem vyzkoušel všechny kódování
StreamReader reader = new StreamReader(responseStream, true);
content = reader.ReadToEnd();
Pak to zkoušim:
Encoding z = Encoding.GetEncoding("windows-1250"); //v tom je stránka
Encoding _do = Encoding.ASCII; //tady zkoušim různý..
byte[] bytes = _do.GetBytes(source);
source = z.GetString(bytes);
Zvláštní je, že ani odstranění diakritiky nefunguje.
Co s tim?