Jak odstranit diakritiku z řetězce
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu
Reklama
Reklama

Jak odstranit diakritiku z řetězceJak odstranit diakritiku z řetězce

 

Jak odstranit diakritiku z řetězce

Google       Google       3. 7. 2006       20 795×

Občas nastane situace, kdy je nutné odstranit z řetězce znaky s diakritikou. .NET 2.0 nabízí spolehlivé řešení problému, protože umí pracovat s takzvanými Unicode kategoriemi.

Reklama
Reklama

Občas se stává, že je nutné z nějakého textu odstranit znaky s diakritikou. Většinou není požadováno jejich úplné odstranění, ale nahrazení za jejich ekvivalenty bez diakritiky, aby text zůstal čitelný. V .NET 2.0 je řešení celého problému snadnější, než se může zdát.

Ve starších verzích .NET by bylo nutné vytvořit seznam písmen s diakritikou a k nim přiřadit jejich ekvivalenty. Následně by pak docházelo k postupnému nahrazování písmen v textu, ale toto řešení není příliš spolehlivé, protože většinou nevytvoříte kompletní seznam všech existujících znaků s diakritikou. V .NET 2.0 je naštěstí možné pracovat s tzv. Unicode kategoriemi.

S pomocí níže uvedené metody se oddělí znak od jeho modifikátoru, zkontrolují se všechny znaky a ze znaků, které nejsou modifikátory, se sestaví nový řetězec. Nebudu vysvětlovat, co znamenají všechny modifikátory metod, návratový typ a další klíčová slova – to je úkolem lektora zdejšího kurzu jazyka C#.


public static string RemoveDiacritics(String s)
{
    // oddělení znaků od modifikátorů (háčků, čárek, atd.)
    s = s.Normalize(System.Text.NormalizationForm.FormD);
    System.Text.StringBuilder sb = new System.Text.StringBuilder();

    for (int i = 0; i < s.Length; i++)
    {
        // do řetězce přidá všechny znaky kromě modifikátorů
        if (System.Globalization.CharUnicodeInfo.GetUnicodeCategory(s[i]) != System.Globalization.UnicodeCategory.NonSpacingMark)
        {
             sb.Append(s[i]);
        }
    }

     // vrátí řetězec bez diakritiky
     return sb.ToString();
}

Metoda Normalize oddělí znaky od jejich modifikátorů. Následný cyklus projde všechny znaky a k řetězci připojí jen ty, které nejsou typu NonSpacingMark, což jsou právě zmiňované modifikátory. Samozřejmě je možné určit, jaké Unicode kategorie mají být odstraněny nebo zachovány.

Zdroj: http://www.msdn.com

×Odeslání článku na tvůj Kindle

Zadej svůj Kindle e-mail a my ti pošleme článek na tvůj Kindle.
Musíš mít povolený příjem obsahu do svého Kindle z naší e-mailové adresy kindle@programujte.com.

E-mailová adresa (např. novak@kindle.com):

TIP: Pokud chceš dostávat naše články každé ráno do svého Kindle, koukni do sekce Články do Kindle.

1 názor  —  1 nový  
Hlasování bylo ukončeno    
0 hlasů
Google
(fotka) Dušan JanošíkDušan vyvíjí software a webové aplikace na platformě .NET. Je milovníkem neuznávaných teorií, a zajímá se o parapsychologii a teraristiku.
Web     Twitter     Facebook     LinkedIn    

Nové články

Obrázek ke článku NEWTON Media prohledá 200  milionů mediálních zpráv během sekund díky Cisco UCS

NEWTON Media prohledá 200 milionů mediálních zpráv během sekund díky Cisco UCS

Česká společnost NEWTON Media provozuje největší archiv mediálních zpráv ve střední a východní Evropě. Mezi její zákazníky patří například ministerstva, evropské instituce nebo komerční firmy z nejrůznějších oborů. NEWTON Media rozesílá svým zákazníkům každý den monitoring médií podle nastavených klíčových slov a nabízí online službu, kde lze vyhledat mediální výstupy v plném znění od roku 1996.

Reklama
Reklama
Obrázek ke článku Delphi 10.1.2 (Berlin Update 2) – na co se můžeme těšit

Delphi 10.1.2 (Berlin Update 2) – na co se můžeme těšit

Touto roční dobou, kdy je zem pokrytá barevným listím a prsty křehnou v mrazivých ránech, se obvykle těšíme na zbrusu novou verzi RAD Studia. Letos si však ale budeme muset počkat na Godzillu a Linux až do jara. Vezměme tedy za vděk alespoň updatem 2 a jelikož dle vyjádření pánů z Embarcadero se budou nové věci objevovat průběžně, pojďme se na to tedy podívat.

Obrázek ke článku Konference: Moderní datová centra pro byznys dneška se koná už 24. 11.

Konference: Moderní datová centra pro byznys dneška se koná už 24. 11.

Stále rostoucí zájem o cloudové služby i maximální důraz na pružnost, spolehlivost a bezpečnost IT vedou k výrazným inovacím v datových centrech. V infrastruktuře datových center hraje stále významnější roli software a stále častěji se lze setkat s hybridními přístupy k jejich budování i provozu.

Obrázek ke článku Konference: Mobilní technologie mají velký potenciál pro byznys

Konference: Mobilní technologie mají velký potenciál pro byznys

Firmy by se podle analytiků společnosti Gartner měly  rychle přizpůsobit skutečnosti, že mobilní technologie už zdaleka nejsou horkou novinkou, ale standardní součástí byznysu. I přesto - nebo možná právě proto - tu nabízejí velký potenciál. Kde tedy jsou ty největší příležitosti? I tomu se bude věnovat již čtvrtý ročník úspěšné konference Mobilní řešení pro business.

loadingtransparent (function() { var po = document.createElement('script'); po.type = 'text/javascript'; po.async = true; po.src = 'https://apis.google.com/js/plusone.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(po, s); })();
Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032016 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý