Ahoj, píšu si takový menší projekt v pythonu a potřebuji nahrazovat obsah txt souboru pomocí regulárních výrazů. A tady je problém, chová se to nějak divně.
Například když chci (teď jen z testovacích důvodů) odstranit z obsahu souboru všechny bílé znaky:
soubor test.py:
# -*- coding: utf8 -*-
import os, sys, re
file = open('test.txt', 'r')
content = file.read()
file.close()
print re.sub(r'\s*', '', content, re.MULTILINE|re.DOTALL|re.UNICODE)
soubor test.txt:
;
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
výstup:
;ahojtadyprográmatorahojtadyprográmatorahojtadyprográmator
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
ahoj tady prográmator
Prostě náhrada se provede asi 10x (mezery a zalomení řádků) a zbytek obsahu to ignoruje. Oba soubory jsou v kódování utf-8. Už ten problém řeším od včerejška a nevím si s tím rady.
Děkuji za pomoc