Regulárni výrazy rozbor řetězce preg match

Fórum › PHP

lubík

~ Anonymní uživatel
~ 16 příspěvků

9. 12. 2012 #1

Dobrý den potřeboval bych pomoct s rozboremdvou řádků který vytáhnu z DB,

řádek 1) B14956-H39406-W71-dmg80-13.3.12 (+podložka)

řádek 2) 120366-4064-dmg35-16.3.12 [opak. W56-114660] (podložka)
předem nevím který z těchto dvou řádků vytáhnu z DB v případě že dostanu první řádek potřebuju ho rozebrat tak abych

si do proměnných uložil každou část oddělenou pomlčkou a pak už je jen správně poskládám a upravené pak vložím

zpět do DB

řádek1) $cislo_vykresu-$folge-$slozka-$stroj-$datum ($komentar) <= tyto proměnné zastupují každou část řetězce

.pokud dostanu z DB druhý řádek potřebuji jen nahradit $cislo_vykresu a $datum.

Strávil jsem několik hodin na různých stránkách s regexpama a udělal jsem si na rozbor těch řádků takovýto script

 $reg1= preg_match('w\d{1,9}',$radek_souboru ,$slozka); //cislo slozky
      $reg2= preg_match('[*',$radek_souboru ,$zavorka);   //jestli je zavorka [v retezci a za ni cokoliv
      $reg3= preg_match('-\+-',$radek_souboru ,$folge);   //jakykoliv znaky mezi pomlckama 
      $reg4= preg_match('[okuma]',$radek_souboru ,$stroj);   //jestli je nazev stroje
      $reg5= preg_match('^b\d+-',$radek_souboru ,$cislo_vykresu);   //od zacatku cokoliv co zacina b az po prvni pomlcku
      $reg5= preg_match('\d+\.\d+\.\d+',$radek_souboru ,$datum);   //najit datum cislo tecka cislo tecka cislo
      $reg5= preg_match('\(*$',$radek_souboru ,$komentar);   //od kulate (zavorky az do konce radku

ale bohužel mi to ani tochu nefunguje prosím Vás o pomoc jak by to mělo být správně

Nahlásit jako SPAM

IP: 89.103.94.–

lubík

~ Anonymní uživatel
~ 16 příspěvků

9. 12. 2012 #2

#1 lubík
všiml jsem si že jsem špatně popsal proměnné - jsou tam tři proměnné $reg5 ale po opravě ani to nepomhlo pro

správný chod programu

Nahlásit jako SPAM

IP: 89.103.94.–

ench0

Stálý člen

9. 12. 2012 #3

Co se týče toho "si do proměnných uložil každou část oddělenou pomlčkou a pak už je jen správně poskládám a upravené pak vložím" tak by mě zajímalo, zda není lepší si to rovnou ukládat do sloupců v databázi odděleně. Netuším ale k čemu ten kód (string) má sloužit. Viz 1. normální forma (http://cs.wikipedia.org/…atab%C3%A1ze)

Co se týče toho "předem nevím který z těchto dvou řádků vytáhnu z DB" k tomu by ses měl zamyslet, abys to vždy věděl, který řetězec z databáze taháš. Například dalším sloupcem v DB, který ti říká, o jaký typ toho řetězce se jedná.

"si do proměnných uložil každou část oddělenou pomlčkou a pak už je jen správně poskládám a upravené pak vložím"

na to je super funkce explode() - ta ti zde očividně ale nepomůže. Protože se ti pomlčka vyskytuje v závorkách a mám pocit, že tu závorku nechceš rozdělit.

Můžeš prosím popsat v čem se liší první řádek od druhého? Je to počtem segmentů oddělených pomlčkami, nebo to je písmenem na začátků těch segmentů či to je v něčem jiném?

Nahlásit jako SPAM

IP: 46.13.114.–

I programování je pudová záležitost. Buď to pude, nebo to nepude

Flowy

~ Anonymní uživatel
~ 449 příspěvků

9. 12. 2012 #4

Docital som sa ze pattern by mal obsahovat delimiter (pravdepodobne pre urcenie jeho tagov) to je pravdepodobne dovod preco ti to nejde

Ja by som ale pouzil match_all so subpatternmi a tu si celkom jednoducho oddelis slova na zaklade pomlciek a tiez mozes dobre pokrit aj jednotlive riadky

Nahlásit jako SPAM

IP: 178.41.146.–

lubík

~ Anonymní uživatel
~ 16 příspěvků

10. 12. 2012 #5

v DB je takovýchto řádků přes 40 000 a jsou to zápisy mých jkolegů z práce a moje vize je právě taková že by jsem

každou tu část uložil do proměnné a pak je vložil do jednotlivých tabulek aby to bylo pěkně rozsortované jsou to zápisy

archiuvované od roku 1995 v té době nikdo neřešil rozdělování do sloupců a tabulek v té době to zapisovali do office xlsx dokumentu a já jsem to teď poděďil a chtěl bych si to srovnat a dát do DB vše jsemn si už udělal už jen to roztřídění a to nevím jak to udělat na ty delimitery jsem už koukal ale vůbec je nechápu podle mě to jsou znaky na začátku a konci který jsou povinný. když jsem je tam vložil tak už to nic o delimiterech nepsalo ale píše to že Pole na String tady je chyba

Notice: Array to string conversion in C:\Complex-Web-Server-2\www\programatori\mlaticka\vyhledej_zapis.php on line 170

Notice: Array to string conversion in C:\Complex-Web-Server-2\www\programatori\mlaticka\vyhledej_zapis.php on line 170
ArrayArrayArrayArrayArrayArray

těch šest Array za sebou je výsledek po echu všech proměnných ,dal jsem si všechny proměnný vypsat a místo jednotlivých částí toho řádku to vypsalo jen Array ,tady netuším proč to píše že převádím pole na string??, jediný kde s Polem pracuji ,je ten řádek a ten jsem z DB vytáhl pomocí pole kód je asi takovýto

      $dotaz= "SELECT vykresy FROM rok2012 WHERE vykresy LIKE '%$hledany_text%'";        
       $sql=mysql_query($dotaz)or die (mysql_error());
     $num=0;
                      //cyklus
   while($r=mysql_fetch_array($sql)) {
     $r["vykresy"];
     $num++;
     $radek_souboru=$r["vykresy"];          
               
                 $reg1= preg_match('/w\d{1,9}/',$radek_souboru ,$slozka); //cislo slozky
      $reg2= preg_match('/[*/',$radek_souboru ,$zavorka);   //jestli je zavorka [v retezci a za ni cokoliv
      $reg3= preg_match('/-\+-/',$radek_souboru ,$folge);   //jakykoliv znaky mezi pomlckama 
      $reg4= preg_match('/[okuma]/',$radek_souboru ,$stroj);   //jestli je nazev stroje
      $reg5= preg_match('/^b\d+-/',$radek_souboru ,$cislo_vykresu);   //od zacatku cokoliv co zacina b az po prvni pomlcku
      $reg6= preg_match('/\d+\.\d+\.\d+/',$radek_souboru ,$datum);   //najit datum cislo tecka cislo tecka cislo
      $reg7= preg_match('/\(*$/',$radek_souboru ,$komentar);   //od kulate (zavorky az do konce radku
         echo $slozka.$zavorka.$folge.$stroj.$cislo_vykresu.$datum.$komentar;

Nahlásit jako SPAM

IP: 89.103.94.–

lubík

~ Anonymní uživatel
~ 16 příspěvků

10. 12. 2012 #6

ještě jsem tam zapoměl dokopírovat chybu která patří k těm ostatním šesti

Warning: preg_match() [function.preg-match.html]: Compilation failed: missing terminating ] for character class at offset 2 in C:\Complex-Web-Server-2\www\programatori\mlaticka\vyhledej_zapis.php on line 164

tahle chyba se objeví jako první

Nahlásit jako SPAM

IP: 89.103.94.–

ench0

Stálý člen

10. 12. 2012 #7

Zkusil jsem si pohrát s tím regulárním výrazem. Jelikož jsi mi neodpověděl na otázku, tak předpokládám, že se to nebude dát zcela použít, ale mělo by tě to snad popostrčit dál. Použil jsem tam pojmenování subvýrazů (či jak se tomu říká) tudíž můžeš jednotlivé části toho řetězce volat například takto: $matches['cislo_vykresu'] :)

Další věc je, že máš v těch regulárech chyby. Např. '[*' znamená libovolný počet výskytů levých hranatých závorek :) Místo toho bys měl použít toto" '[.*' (tečka znamená jakýkoli znak a hvězdička libovolný počet výskytů. - tedy všechny znaky za levou hranatou závorkou.

Tady je ten kód. Zkusil jsem si to u sebe na těch dvou řetězcích a ten druhý má $matches['slozka'] == "" - což je jediná odlišnost, kterou jsem vydedukoval z těch dvou ukázek. Ještě předpokládám, že stroj má začínat na 'dmg' - toto se vyskytuje opět v obou případech.

$reg = '/^(?P<cislo_vykresu>\w+)\-(?P<folge>\w+)(\-(?P<slozka>\w+))?\-(?P<stroj>dmg\w+)\-(?P<datum>\d{1,2}\.\d{1,2}\.\d{1,2}).{1}(?P<poznamka>.*)$/';

$radek_souboru = "B14956-H39406-W71-dmg80-13.3.12 (+podložka)";
preg_match($reg, $radek_souboru, $matches);
var_dump($matches);

$radek_souboru = "120366-4064-dmg35-16.3.12 [opak. W56-114660] (podložka)";
preg_match($reg, $radek_souboru, $matches);
var_dump($matches);

Nahlásit jako SPAM

IP: 77.242.90.–

I programování je pudová záležitost. Buď to pude, nebo to nepude

lubik

~ Anonymní uživatel
~ 16 příspěvků

10. 12. 2012 #8

Dík moc určitě to vyzkouším v tom druhým řádku mi stačí vědět jen jestli tam je ta zaávorka a pak změním jen číslo výkresu a datum. Rozdíl mezi řádkama je v tom že ten první řádek má tvar který odpovídá tomu že se u nás ve firmě tento kus vyráběl jen jednou a program pro cnc frézu je uložen v takovémto tvaru a ten druhý řádek znamená že takový kus se u nás ve firmě vyráběl více nežli jednou a tvar řádku je s hranatýma závorkama .Já buď dostanu z DB řádek jednoho nebo druhého tvaru a podle toho který řádek dostanu tak podle toho ho přetřídím a pak zase vložím do DB .Myslím že to co jsi napsal mi určitě bude vyhovovat předem moc díky a večer to určitě vyzkouším

Nahlásit jako SPAM

IP: 85.207.55.–

Flowy

~ Anonymní uživatel
~ 449 příspěvků

11. 12. 2012 #9

Pouzivas preg match kde si zadal nazov !tabuliek! kde sa maju vysledky pouzit (uklada sa viac udajov ako sa ti zda pozri si priklady funkcie) v echo s tym pracujes ako so stringom ... To je asi problem ale php nepoznam

Ak by si pouzil match all (dalo by sa aj na cely dokument ale jednoduchsie bude asi na riadok ak sa moc nemusis s regex) tak by si mohol jednoduchsie rozlisovat jednotlive casti pretoze by si definoval jednoducho deliace znaky a ono by ti to vratilo zoradene vyrazy v tabulkach

Regex je velmi uzitocna vec pri praci s textom odporucam naucit sa syntax potom to uz neni zlozite

Nahlásit jako SPAM

IP: 178.41.234.–

lubík

~ Anonymní uživatel
~ 16 příspěvků

11. 12. 2012 #10

Díky moc ENCH . Pro moje účely to funguje absolutně přepichově už jsem to vyzkoušel a jsem moc spokojený, dokonce mi došlo pár věcí který jsem si nedikázal dát do souvislosti a flowy měl pochopitelně pravdu -takhle se pole nevypisuje všem díky

Nahlásit jako SPAM

IP: 89.103.94.–

← Zpět na seznam vláken ← Zpět do Fóra