Jak odstranit diakritiku z řetězce
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu
Reklama

Jak odstranit diakritiku z řetězceJak odstranit diakritiku z řetězce

 
Hledat
Moderní platforma pro vytvoření vašeho nového webu – Wix.com.
Nyní už můžete mít web zdarma.
Vybavení pro Laser Game
Spuštěn Filmový magazín
Laser Game Brno

Jak odstranit diakritiku z řetězce

Google       Google       3. 7. 2006       22 552×

Občas nastane situace, kdy je nutné odstranit z řetězce znaky s diakritikou. .NET 2.0 nabízí spolehlivé řešení problému, protože umí pracovat s takzvanými Unicode kategoriemi.

Reklama
Reklama

Občas se stává, že je nutné z nějakého textu odstranit znaky s diakritikou. Většinou není požadováno jejich úplné odstranění, ale nahrazení za jejich ekvivalenty bez diakritiky, aby text zůstal čitelný. V .NET 2.0 je řešení celého problému snadnější, než se může zdát.

Ve starších verzích .NET by bylo nutné vytvořit seznam písmen s diakritikou a k nim přiřadit jejich ekvivalenty. Následně by pak docházelo k postupnému nahrazování písmen v textu, ale toto řešení není příliš spolehlivé, protože většinou nevytvoříte kompletní seznam všech existujících znaků s diakritikou. V .NET 2.0 je naštěstí možné pracovat s tzv. Unicode kategoriemi.

S pomocí níže uvedené metody se oddělí znak od jeho modifikátoru, zkontrolují se všechny znaky a ze znaků, které nejsou modifikátory, se sestaví nový řetězec. Nebudu vysvětlovat, co znamenají všechny modifikátory metod, návratový typ a další klíčová slova – to je úkolem lektora zdejšího kurzu jazyka C#.


public static string RemoveDiacritics(String s)
{
    // oddělení znaků od modifikátorů (háčků, čárek, atd.)
    s = s.Normalize(System.Text.NormalizationForm.FormD);
    System.Text.StringBuilder sb = new System.Text.StringBuilder();

    for (int i = 0; i < s.Length; i++)
    {
        // do řetězce přidá všechny znaky kromě modifikátorů
        if (System.Globalization.CharUnicodeInfo.GetUnicodeCategory(s[i]) != System.Globalization.UnicodeCategory.NonSpacingMark)
        {
             sb.Append(s[i]);
        }
    }

     // vrátí řetězec bez diakritiky
     return sb.ToString();
}

Metoda Normalize oddělí znaky od jejich modifikátorů. Následný cyklus projde všechny znaky a k řetězci připojí jen ty, které nejsou typu NonSpacingMark, což jsou právě zmiňované modifikátory. Samozřejmě je možné určit, jaké Unicode kategorie mají být odstraněny nebo zachovány.

Zdroj: http://www.msdn.com

×Odeslání článku na tvůj Kindle

Zadej svůj Kindle e-mail a my ti pošleme článek na tvůj Kindle.
Musíš mít povolený příjem obsahu do svého Kindle z naší e-mailové adresy kindle@programujte.com.

E-mailová adresa (např. novak@kindle.com):

TIP: Pokud chceš dostávat naše články každé ráno do svého Kindle, koukni do sekce Články do Kindle.

1 názor  —  1 nový  
Hlasování bylo ukončeno    
0 hlasů
Google
(fotka) Dušan JanošíkDušan vyvíjí software a webové aplikace na platformě .NET. Je milovníkem neuznávaných teorií, a zajímá se o parapsychologii a teraristiku.
Web     Twitter     Facebook     LinkedIn    

Nové články

Obrázek ke článku SODAT vidí budoucnost datové bezpečnosti ve strojovém učení

SODAT vidí budoucnost datové bezpečnosti ve strojovém učení

Firmy chrání svá citlivá data často nedostatečně. Podle průzkumu společnosti SODAT se v minulém roce setkalo až 80 % z nich s bezpečnostním incidentem ztráty nebo úniku dat. Jedna z pilotních firem, která testovala novou verzi řešení SODAT Protection & Analytics 2.0pro bezpečností analýzu a monitoring dat díky novince zjistila, kdo z disku smazal důležité výkresy a mohla na incident včas reagovat.

Reklama
Reklama
Obrázek ke článku Kontrolujete pracovní emaily i na dovolené? 7 tipů odborníka, jak nepřijít o data

Kontrolujete pracovní emaily i na dovolené? 7 tipů odborníka, jak nepřijít o data

Letní měsíce jsou pro většinu zaměstnanců spojené s každoroční dovolenou. Z údajů Českého statistického úřadu vyplývá, že v roce 2017 podnikli Češi přes 13 milionů delších cest (tzn. s více než čtyřmi noclehy). Přitom právě na období července, srpna a září připadá více než 7,5 milionů z nich. Nicméně tradiční představu o dovolené jako o čase, kdy má práci na starost někdo jiný, Češi boří. 

Obrázek ke článku 10 SEO mýtů, které už nemusíte v roce 2018 řešit

10 SEO mýtů, které už nemusíte v roce 2018 řešit

„Kolik má být na stránce klíčových slov?“, „Nemáš vyplněný meta tag keywords, to nebude fungovat.“, „Katalogy jsou mrtvý“. Také jste už slyšeli některé z těchto otázek? Pojďme si na ně konečně jednou provždy odpovědět.

Obrázek ke článku Trend Micro pomohlo usvědčit viníky v mezinárodním případu Scan4You

Trend Micro pomohlo usvědčit viníky v mezinárodním případu Scan4You

Společnost Trend Micro Incorporated, globální lídr v oblasti kybernetické bezpečnosti, oznámila podrobnosti o své úzké spolupráci s FBI v případu Scan4You. Trend Micro se podílelo na identifikaci osob, které byly spojeny se službou Scan4You Counter Antivirus, což vedlo k jejich odsouzení.

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032018 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý