Jak odstranit diakritiku z řetězce
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Jak odstranit diakritiku z řetězceJak odstranit diakritiku z řetězce

 
Hledat
Vybavení pro Laser Game
Spuštěn Filmový magazín
Laser Game Brno
Pergoly a střechy Brno

Jak odstranit diakritiku z řetězce

Google       Google       3. 7. 2006       25 374×

Občas nastane situace, kdy je nutné odstranit z řetězce znaky s diakritikou. .NET 2.0 nabízí spolehlivé řešení problému, protože umí pracovat s takzvanými Unicode kategoriemi.

Reklama
Reklama

Občas se stává, že je nutné z nějakého textu odstranit znaky s diakritikou. Většinou není požadováno jejich úplné odstranění, ale nahrazení za jejich ekvivalenty bez diakritiky, aby text zůstal čitelný. V .NET 2.0 je řešení celého problému snadnější, než se může zdát.

Ve starších verzích .NET by bylo nutné vytvořit seznam písmen s diakritikou a k nim přiřadit jejich ekvivalenty. Následně by pak docházelo k postupnému nahrazování písmen v textu, ale toto řešení není příliš spolehlivé, protože většinou nevytvoříte kompletní seznam všech existujících znaků s diakritikou. V .NET 2.0 je naštěstí možné pracovat s tzv. Unicode kategoriemi.

S pomocí níže uvedené metody se oddělí znak od jeho modifikátoru, zkontrolují se všechny znaky a ze znaků, které nejsou modifikátory, se sestaví nový řetězec. Nebudu vysvětlovat, co znamenají všechny modifikátory metod, návratový typ a další klíčová slova – to je úkolem lektora zdejšího kurzu jazyka C#.


public static string RemoveDiacritics(String s)
{
    // oddělení znaků od modifikátorů (háčků, čárek, atd.)
    s = s.Normalize(System.Text.NormalizationForm.FormD);
    System.Text.StringBuilder sb = new System.Text.StringBuilder();

    for (int i = 0; i < s.Length; i++)
    {
        // do řetězce přidá všechny znaky kromě modifikátorů
        if (System.Globalization.CharUnicodeInfo.GetUnicodeCategory(s[i]) != System.Globalization.UnicodeCategory.NonSpacingMark)
        {
             sb.Append(s[i]);
        }
    }

     // vrátí řetězec bez diakritiky
     return sb.ToString();
}

Metoda Normalize oddělí znaky od jejich modifikátorů. Následný cyklus projde všechny znaky a k řetězci připojí jen ty, které nejsou typu NonSpacingMark, což jsou právě zmiňované modifikátory. Samozřejmě je možné určit, jaké Unicode kategorie mají být odstraněny nebo zachovány.

Zdroj: http://www.msdn.com

×Odeslání článku na tvůj Kindle

Zadej svůj Kindle e-mail a my ti pošleme článek na tvůj Kindle.
Musíš mít povolený příjem obsahu do svého Kindle z naší e-mailové adresy kindle@programujte.com.

E-mailová adresa (např. novak@kindle.com):

TIP: Pokud chceš dostávat naše články každé ráno do svého Kindle, koukni do sekce Články do Kindle.

2 názory  —  2 nové  
Hlasování bylo ukončeno    
0 hlasů
Google
(fotka) Dušan JanošíkDušan vyvíjí software a webové aplikace na platformě .NET. Je milovníkem neuznávaných teorií, a zajímá se o parapsychologii a teraristiku.
Web     Twitter     Facebook     LinkedIn    

Nové články

Obrázek ke článku Síla týmů se na home office může vytrácet. Odborníci radí, jak z pracovních omezení vytěžit maximum

Síla týmů se na home office může vytrácet. Odborníci radí, jak z pracovních omezení vytěžit maximum

Za poslední rok se podoba práce zaměstnanců změnila k nepoznání. Především plošné zavedení home office, které mělo být zpočátku jen dočasným opatřením, je pro mnohé už více než rok každodenní realitou. Co ale dělat, když se při práci z domova ztrácí motivace, zaměstnanci přestávají komunikovat a dříve fungující tým se rozpadá na skupinu solitérů? Odborníci na personalistiku dali dohromady několik rad, jak udržet tým v chodu, i když pracovní podmínky nejsou ideální.

Reklama
Reklama
Obrázek ke článku Konference: Moderní informační systémy podporují automatizaci

Konference: Moderní informační systémy podporují automatizaci

Současná situace v šíření onemocnění Covid-19 klade na řadu firem nové nároky a mnohé z nich jsou nyní více než kdy jindy závislé na nejmodernějších informačních technologiích. Proto i v oblasti podnikových informačních systémů vidíme rostoucí důraz na automatizaci nebo na důslednou integraci. Také o těchto trendech se bude mluvit na konferenci Firemní informační systémy, která se koná 24.9.2020 v pražském Kongresovém centru Vavruška na Karlově náměstí.

Obrázek ke článku Nebezpečí ukrytá v USB: z nuly na škvarek za pět sekund

Nebezpečí ukrytá v USB: z nuly na škvarek za pět sekund

Za cenu šesti dolarů lze celkem bez obtíží koupit nový, líbivě vyhlížející flash disk. Přidaná hodnota, které se vám spolu s ním dostane, už tak moc líbivá není. To, co se před pár sekundami tvářilo jako externí disk, se po připojení k počítači změní v důmyslné elektrické křeslo, které vaše zařízení v onen příslovečný škvarek promění za pár sekund. Cílovou skupinou pro koupi takových zařízení by mohli být záškodníci, kteří by tímto způsobem osnovali pomstu třeba vůči záletnému partnerovi. 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032021 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý