Jak odstranit diakritiku z řetězce
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Jak odstranit diakritiku z řetězceJak odstranit diakritiku z řetězce

 
Hledat
Vybavení pro Laser Game
Spuštěn Filmový magazín
Laser Game Brno
Laser Game Ostrava

Jak odstranit diakritiku z řetězce

Google       Google       3. 7. 2006       24 411×

Občas nastane situace, kdy je nutné odstranit z řetězce znaky s diakritikou. .NET 2.0 nabízí spolehlivé řešení problému, protože umí pracovat s takzvanými Unicode kategoriemi.

Reklama
Reklama

Občas se stává, že je nutné z nějakého textu odstranit znaky s diakritikou. Většinou není požadováno jejich úplné odstranění, ale nahrazení za jejich ekvivalenty bez diakritiky, aby text zůstal čitelný. V .NET 2.0 je řešení celého problému snadnější, než se může zdát.

Ve starších verzích .NET by bylo nutné vytvořit seznam písmen s diakritikou a k nim přiřadit jejich ekvivalenty. Následně by pak docházelo k postupnému nahrazování písmen v textu, ale toto řešení není příliš spolehlivé, protože většinou nevytvoříte kompletní seznam všech existujících znaků s diakritikou. V .NET 2.0 je naštěstí možné pracovat s tzv. Unicode kategoriemi.

S pomocí níže uvedené metody se oddělí znak od jeho modifikátoru, zkontrolují se všechny znaky a ze znaků, které nejsou modifikátory, se sestaví nový řetězec. Nebudu vysvětlovat, co znamenají všechny modifikátory metod, návratový typ a další klíčová slova – to je úkolem lektora zdejšího kurzu jazyka C#.


public static string RemoveDiacritics(String s)
{
    // oddělení znaků od modifikátorů (háčků, čárek, atd.)
    s = s.Normalize(System.Text.NormalizationForm.FormD);
    System.Text.StringBuilder sb = new System.Text.StringBuilder();

    for (int i = 0; i < s.Length; i++)
    {
        // do řetězce přidá všechny znaky kromě modifikátorů
        if (System.Globalization.CharUnicodeInfo.GetUnicodeCategory(s[i]) != System.Globalization.UnicodeCategory.NonSpacingMark)
        {
             sb.Append(s[i]);
        }
    }

     // vrátí řetězec bez diakritiky
     return sb.ToString();
}

Metoda Normalize oddělí znaky od jejich modifikátorů. Následný cyklus projde všechny znaky a k řetězci připojí jen ty, které nejsou typu NonSpacingMark, což jsou právě zmiňované modifikátory. Samozřejmě je možné určit, jaké Unicode kategorie mají být odstraněny nebo zachovány.

Zdroj: http://www.msdn.com

×Odeslání článku na tvůj Kindle

Zadej svůj Kindle e-mail a my ti pošleme článek na tvůj Kindle.
Musíš mít povolený příjem obsahu do svého Kindle z naší e-mailové adresy kindle@programujte.com.

E-mailová adresa (např. novak@kindle.com):

TIP: Pokud chceš dostávat naše články každé ráno do svého Kindle, koukni do sekce Články do Kindle.

2 názory  —  2 nové  
Hlasování bylo ukončeno    
0 hlasů
Google
(fotka) Dušan JanošíkDušan vyvíjí software a webové aplikace na platformě .NET. Je milovníkem neuznávaných teorií, a zajímá se o parapsychologii a teraristiku.
Web     Twitter     Facebook     LinkedIn    

Nové články

Obrázek ke článku Využití .htaccess na malém webu

Využití .htaccess na malém webu

V dnešní době existuje spoustu cms, které mnohdy ale vůbec nepotřebujeme a stačila by nám pouze základní funkčnost k úpravě url, přesměrování. K tomuto účelu je ideální .htaccess soubor, který nám se všemi těmato úpravami umí pomoct.

Reklama
Reklama
Obrázek ke článku Češi tlačí obce do otevřené komunikace – Mobilní Rozhlas si loni pořídilo dalších 171 měst a obcí

Češi tlačí obce do otevřené komunikace – Mobilní Rozhlas si loni pořídilo dalších 171 měst a obcí

Obyvatelé Česka se mnohem více zapojují do veřejného dění. Umožňují jim to přímo samosprávy, které stále častěji využívají nástroje takzvané chytré komunikace a participace. Dokládají to data za rok 2019 ekosystému Mobilní Rozhlas, lídra v oblasti chytré obecní komunikace. Zapojilo se do něj 171 nových měst a obcí, zaregistrovalo celkem 100 tisíc občanů a místní samosprávy jeho prostřednictvím rozeslaly třikrát více adresných zpráv než v roce 2018

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032020 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý