Načítání řetězců ze souboru – Python – Fórum – Programujte.com
 x   TIP: Přetáhni ikonu na hlavní panel pro připnutí webu

Načítání řetězců ze souboru – Python – Fórum – Programujte.comNačítání řetězců ze souboru – Python – Fórum – Programujte.com

 

kuba
~ Anonymní uživatel
59 příspěvků
21. 5. 2009   #1
-
0
-

Čau, měl bych na vás jednu otázku.
Snažím se udělat prográmek, který vybírá ze souboru jen slova, která odpovídají kombinaci zadaných písmen, takže když zadám například 'k, o, d, y' vyleze me kod, dok, kdy, kdo, atd.
Pokud se zadají písmena bez diakritiky vše je OK, ale hned jak zadám 'á,í,é,..' tak je problém, pro příklad 'á' z klávesnice se uloží jako '\xa0', ale ze souboru se načte jako 'beta'.
Vím, že je nejspíš problém v kódování, ale vůbec nevím, jak to opravit.
Kódování jsem použil iso-8859-2.



for radek in self.soubor:

...

for pismeno in radek:
if pismeno in pismenaK:
pismenaK.remove(pismeno)
i += 1
else:
break

Nahlásit jako SPAM
IP: 195.113.126.–
Koumes21
~ Anonymní uživatel
18 příspěvků
21. 5. 2009   #2
-
0
-

Kódování jsem použil iso-8859-2.


Dost jde o to, jestli jsi použil tohle kódování v souboru se skriptem nebo v souboru, ze kterého načítáš slova. Budu předpokládat, že jde o druhý případ, protože to dává větší smysl. Po té co načteš řetězec ze souboru je dobré si ho převést na Unicode, v tvém případě takhle:
text_v_unicode = nacteny_text.decode("iso-8859-2")

Pak taky musíš převést na Unicode to, co načteš z klávesnice, to by mělo jít nějak takhle:
text_v_unicode = nacteny_text.decode(sys.stdin.encoding) # nezapomeň na 'import sys'

Mám pocit, že na tohle ses ptal, kdyby ne, tak upřesni svůj dotaz
P.S.: Tohle se týká Pythonu 2.5, u dalších verzí mám pocit, že se něco s Unicode měnilo, ale stejně můžeš zkusit.

Nahlásit jako SPAM
IP: 212.24.152.–
kuba
~ Anonymní uživatel
59 příspěvků
22. 5. 2009   #3
-
0
-

Super, díky moc, to je přesně to co jsem potřeboval :) .

Nahlásit jako SPAM
IP: 78.128.150.–
Zjistit počet nových příspěvků

Přidej příspěvek

Toto téma je starší jak čtvrt roku – přidej svůj příspěvek jen tehdy, máš-li k tématu opravdu co říct!

Ano, opravdu chci reagovat → zobrazí formulář pro přidání příspěvku

×Vložení zdrojáku

×Vložení obrázku

Vložit URL obrázku Vybrat obrázek na disku
Vlož URL adresu obrázku:
Klikni a vyber obrázek z počítače:

×Vložení videa

Aktuálně jsou podporována videa ze serverů YouTube, Vimeo a Dailymotion.
×
 
Podporujeme Gravatara.
Zadej URL adresu Avatara (40 x 40 px) nebo emailovou adresu pro použití Gravatara.
Email nikam neukládáme, po získání Gravatara je zahozen.
-
Pravidla pro psaní příspěvků, používej diakritiku. ENTER pro nový odstavec, SHIFT + ENTER pro nový řádek.
Sledovat nové příspěvky (pouze pro přihlášené)
Sleduj vlákno a v případě přidání nového příspěvku o tom budeš vědět mezi prvními.
Reaguješ na příspěvek:

Uživatelé prohlížející si toto vlákno

Uživatelé on-line: 0 registrovaných, 9 hostů

 

Hostujeme u Českého hostingu       ISSN 1801-1586       ⇡ Nahoru Webtea.cz logo © 20032024 Programujte.com
Zasadilo a pěstuje Webtea.cz, šéfredaktor Lukáš Churý