Podíváme se na tuto zajímavou metodu používanou nejen v matematice. Regresní analýza slouží k odhadování výsledků z jiných známých hodnot.
Regrese je metoda, která je, řekl bych, docela zajímavá a hlavně prakticky použitelná. Regresí je několik druhů – lineární, exponenciální, logaritmická, mocninná a další. Předmětem toho dvoudílného miniseriálu budou první tři zmíněné druhy. A rovnou se pustíme do lineární regrese.
Lineární regrese:
Lineární regrese nám slouží pro výpočty hodnot Y ze zadané hodnoty X a ze „vzorových“ dat. Zadáme-li tedy data (alespoň dvě dvojce) ve tvaru (x,y) (4,3 a 5,1
) a budeme-li potom chtít zjistit hodnotu y pro x = 6
, získáme číslo −1
. To vyplývá i z grafu:
Pokud ovšem zadáme hodnot více a ony nejsou úplně lineární (spojnice bodů nevytvoří přímku), potom se celý graf, řekněme, nějak zprůměruje (zjednodušeně řečeno). Zadáme-li tedy hodnoty 1,2; 2,4; 3,8
, nebude průběhem zelená křivka, ale červená přímka.
Nyní ale k programování. Prvně si vytvoříme regresi pomocí, řekněme, statického kódu, který bude y vypočítávat pouze podle dvou vzorových dvojic dat. No a nebylo by úplně od věci uvést vzorečky, podle kterých to všechno počítá.
No a teď tedy kód:
xa = 1 'vzorky x
xb = 2
ya = 3 'vzorky y
yb = 4
n = 2 'počet vzorků
'výpočet regresního koeficientu B
B = ((n * ((xa * ya) + (xb * yb))) - ((xa + xb) * (ya + yb))) / ((n * ((xa * xa) + (xb * xb)) - ((xa + xb) * (xa + xb))))
'výpočet regresního koeficientu A
A = ((ya + yb) - (B * (xa + xb))) / (n)
x = 0 'hodnota, kterou chceme dopočítat
y = A + (B * x) 'závěrečný vzorec pro výpočet y
Pokud chceme používat tři parametry, potom je zde upravený kód, který je schopný toliko parametrů pojmout.
xa = 1 'vzorky x
xb = 2
xc = 3
ya = 2 'vzorky y
yb = 2.5
yc = 3
n = 3 'počet vzorků
'výpočet regresního koeficientu B
B = ((n * ((xa * ya) + (xb * yb) + (xc * yc))) - ((xa + xb + xc) * (ya + yb + yc))) / ((n * ((xa * xa) + (xb * xb) + (xc * xc)) - ((xa + xb + xc) * (xa + xb + xc))))
'výpočet regresního koeficientu A
A = ((ya + yb + yc) - (B * (xa + xb + xc))) / n
x = 0 'hodnota, kterou chceme dopočítat
y = A + (B * x) 'závěrečný vzorec pro výpočet y
Ale nyní přistupme k variabilnějšímu programu. Nejenže bude umožňovat vložit n dat, ale bude umět vykreslit i graf (i když ne v tomto článku – na to si budete muset ob článek počkat).
Dim data(256, 1) As Single
Dim sumxy As Single
Dim sumx As Single
Dim sumy As Single
Dim sumx2 As Single
Dim n As Byte
Dim x As Single
Dim y As Single
Dim A As Single
Dim B As Single
n = InputBox("Zadej počet vzorů", "Požadavek na data", "2")
temp = n - 1
For i = 0 To temp
x = InputBox("Zadej hodnotu x dat pro n = " & i + 1, "Požadavek na data", "0")
y = InputBox("Zadej hodnotu y dat pro n = " & i + 1, "Požadavek na data", "0")
data(i, 0) = x
data(i, 1) = y
Next i
sumxy = 0
sumx = 0
sumy = 0
sumx2 = 0
For i = 0 To temp
sumxy = sumxy + data(i, 0) * data(i, 1)
sumx = sumx + data(i, 0)
sumy = sumy + data(i, 1)
sumx2 = sumx2 + (data(i, 0) * data(i, 0))
Next i
B = ((n * sumxy) - (sumx * sumy)) / ((n * sumx2) - (sumx * sumx))
Print B
A = (sumy - (B * sumx)) / n
Print A
Min = InputBox("Zadej interval grafu hodnotu min: ", "Požadavek na data", "0")
Max = InputBox("Zadej interval grafu hodnotu max: ", "Požadavek na data", "0")
For x = Min To Max
y = A + (B * x)
Print "x = " & x & ", y = " & y
Next x
Tedy to by byla základní část bez grafu. K tomu grafu zatím jen tak naznačím. Funkce: Line − (offsetx + (x * zoom),offsety − (y * zoom))
to všechno jistí. Pomocí proměnných offsetx a offsety si zvolíte střed a pomocí zoomu potom měřítko.
V cyklu For … Next nezapomínejte na možnost použití Step. Určitě by vám to při práci hodně pomohlo a možná nebudete potřebovat tolik zoomu. Pozor ale, Step mění měřítko pouze na jedné ose.
Není úplně od věci si při grafu zároveň tisknout na obrazovku kótování, je to sice celkem dost kódu, ale stojí to za to.
No v příštím díle se podíváme na exponenciální regresi.