Korelační indikátory těsnosti pro multifaktorový korelační-regresní model




Blízkost vztahu mezi studovanými parametry v případě vícenásobné korelace je určena na základě různých koeficientů. Aby regresní rovnice přiměřeně odrážala (přibližné) reálné simulované socioekonomické procesy nebo jevy, musí být splněny podmínky a požadavky vícenásobné korelační a regresní analýzy.

Korelační - regresní analýza : analytická exprese rovnice (přímočaré, křivočelové) regrese pro multifactoriální korelační - regresní model. Stanovení parametrů a jejich interpretace.

Blízkost vztahu mezi nimi je měřena poměrem rozptylu faktoru k celkovému rozptylu výsledného atributu, nazývaného index určení. Index určení charakterizuje poměr variace výsledného znaku pod vlivem faktorového znaku v celkové variabilitě výsledné vlastnosti. Je-li mezi znaménkem korelace, potom se zvyšuje, tj. čímž se zvyšuje blízkost vztahů mezi výrobními a faktografickými znaky, index určování se zvyšuje a snižuje, jak oslabuje. Index zjišťování tedy charakterizuje blízkost spojení, blízkost korelace s funkční.

Druhá odmocnina indexu určení je korelační index nebo teoretický korelační poměr . Korelační index nebo teoretický korelační poměr charakterizuje blízkost spojení s jakoukoliv formou závislosti. Zbytková disperze Je nutné vybrat nejlepší funkci, která nejvíce vyrovnává (aproximuje) empirickou regresní přímku. Přibližující funkce se volí podle minimální zbytkové disperze s 2 OST = S (y t - ) 2 / n nebo .

Zvláštním případem korelačního indexu je lineární korelační koeficient r , který se používá k odhadu blízkosti vztahu s lineárním vztahem. Korelační koeficient má hodnoty od -1 do +1, což znamená nejen blízkost, ale i směr vztahu. Znak "+" označuje přímý vztah mezi efektivními a faktografickými znaky, znaménko "-" označuje inverzní vztah mezi nimi. Pokud r = 0, pak mezi těmito značkami neexistuje žádná spojnice. Čím blíže r je k jednomu, tím bližší je spojení mezi zvažovanými rysy.

V lineární formě komunikace je parametrem rovnice přímky regresní koeficient a 1 a korelační koeficient r vzájemně propojeny takto:

a 1 = rs y / s x . V případě přímého připojení je lineární koeficient korelace shodný s korelačním indexem, jsou číselně stejné: .

Lineární korelační koeficient r se používá k odhadu těsnosti spojení s lineárním vztahem: rovnice = a 0 + a 1 x


border=0


Pro zjednodušení výpočtů lineárního korelačního koeficientu použijte transformovaný vzorec: .

Povaha vztahu je určena hodnotou korelačního koeficientu:

r hodnota korelačního koeficientu komunikační charakter
r = 0 až do 0,3 prakticky chybí
0 <r <1 0,3 - 0,5 + rovný slabý
-1 <r <0 0,5 - 0,7 - obráceně mírné
r = 1 0,7 - 1,0 1 - funkční silný

Význam lineárního korelačního koeficientu je určen kritériem t - Student. Určeno vypočítanou hodnotou t calc , která je porovnána s tabulkovou hodnotou t crit . Lineární korelační koeficient se považuje za významný, pokud poměr: t calc > t crit .

s n s n <50.

t crit je určena tabulkou "Hodnota kritéria t - studenta na úrovni významnosti 0,10, 0,05, 0,01 a stupně volnosti .

Úkolem mnohofaktorové korelace - regresní analýzy je především studium řady faktorů ovlivňujících sledovaný ukazatel a výběr nejvýznamnějších faktorů; za druhé, při stanovení stupně vlivu každého faktoru na výsledný atribut budováním modelu - vícenásobné regresní rovnice, která umožňuje určit, ve kterém směru a jakou částku se změní efektivní indikátor, když se změní každý faktor vstupující do modelu; za třetí, v kvantitativním hodnocení blízkosti vztahu mezi efektivním a faktorem.

Matematicky je problém najít analytický výraz funkce = f (x 1 , x 2 , x 3 , ..., x n ), což nejlépe odráží vztah faktoriálních znaků k výsledku. Výsledky teoretické analýzy a možnost jejich uplatnění v praxi závisí na správné volbě regresní funkce, proto by forma spojení měla nejlépe odpovídat skutečně existujícím vazbám mezi výslednými a faktoriálními charakteristikami. Obtížnost výběru funkce spočívá v tom, že efektivní prvek s různými faktory může být v různých formách spojení - rovný a křivočarý. Empirické ospravedlnění typu funkce pomocí grafů spárovaných vztahů je prakticky nevhodné pro vícenásobnou korelaci a regresi.



Volba formy vícenásobné regresní rovnice je založena na teoretické analýze studovaného jevu. Pokud analýza vzájemných vztahů mezi efektivními a faktografickými znaky neumožňuje, aby se člověk zabýval nějakou formou spojení, jsou různé funkce vyřešeny a optimální je vybírán tak, aby byl vyrovnán z pohledu blízkosti empirických hodnot efektivní charakteristiky, ale to vyžaduje značné úsilí při výpočtu parametrů různých rovnic. Pokud existuje speciální software, který implementuje algoritmus pro iteraci přes různé PCR rovnice, získává se několik modelů, nejlepší je vybráno statistickým zkontrolováním parametrů rovnice na základě Studentova t-kritéria a Fisherova F-kritéria .

Volba formy rovnice vícenásobné regrese se provádí v praxi

založené na použití pěti typů modelů :

lineární 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

napájení ;

orientační ;

parabolický

hyperbolické

Nejčastěji se zastavují na lineárních modelech. To se vysvětluje skutečností, že parametry lineárních rovnic jsou jednoduše interpretovány, samotné modely jsou jednoduché a vhodné pro ekonomickou analýzu a za druhé, pokud je to žádoucí, lze libovolnou funkci snížit na lineární formou logaritmováním nebo změnou proměnných.

V lineární regresní rovnici v lineární podobě ukazují parametry a 1 , a 2 , a 3 , ..., an - regresní koeficienty stupeň vlivu příslušných faktorů na výsledný atribut, když jsou na průměrné úrovni fixovány další faktory, tj. kolik y se změní se zvýšením odpovídajícího faktoru o 1 bod jeho jednotky změny; parametr a 0 je volný člen, nemá ekonomický význam.

Parametry vícenásobné regresní rovnice a dvojice jsou vypočteny metodou nejmenších čtverců založenou na řešení systému normálních rovnic. Vzhledem k tomu, že regresní koeficienty jsou vzájemně nesrovnatelné (faktory mají různé měřicí jednotky), není možné porovnávat vliv vlivu každého z faktorů obsažených v modelu na výsledný ukazatel na základě regresních koeficientů. Pro posouzení relativní síly vlivu faktorů se vypočítají koeficienty částečné elasticity a b-koeficienty.

Soukromý koeficient elasticity ukazuje, kolik procent průměrného efektivního ukazatele se změní, když se faktor změní o 1% a fixní pozice jiných faktorů a vypočte se zvlášť pro každý faktor:

kde i je regresní koeficient pro i-tý faktor; - průměrná hodnota i-tého faktoru; - průměrnou hodnotu efektivního ukazatele.

Koeficient b ukazuje, která část standardní odchylky mění výsledný atribut, když se odpovídající faktor změní o hodnotu jeho směrodatné odchylky , kde s xi , s y - standardní odchylky i-tého faktoru a výsledná vlastnost.

Vzhledem k tomu, že ekonomické jevy jsou vystaveny četným a složitým příčinám, měly by být do vícenásobné regresní rovnice zahrnuty podstatné, systemativně působící faktory, když je eliminován vliv jiných faktorů. Nejdůležitější faktory se vybírají na základě analýzy blízkosti a významnosti vztahu mezi faktory a efektivním ukazatelem. V tomto případě je podmínkou pro zahrnutí faktorů do modelu absence vzájemně velmi úzkého vztahu mezi nimi, který je blízko k funkčním. Přítomnost velmi úzkého lineárního vztahu mezi dvěma faktory (lineární korelační koeficient r překračuje absolutní hodnotu 0,85) se nazývá kolinearita a mezi několika faktory se říká multiclinearita .

Příčiny multicoliniarity mezi označeními jsou, že za prvé, že analyzované znaky charakterizují stejný aspekt jevu nebo procesu (například velikost kapitálu a počet zaměstnanců charakterizují velikost podniku) a není vhodné je zahrnout do modelu současně; za druhé, faktografické znaky jsou vzájemně se opakujícími prvky vzájemně se kopírovaly nebo jejich celková hodnota dává konstantní hodnotu (např. zdroj energie a poměr kapitál-práce, podíl půjčených a vlastních prostředků). Pokud jsou v modelu zahrnuty vícestranné faktory, potom regresní rovnice neodpovídá skutečně ekonomickým vztahům, parametry modelu budou zkresleny, význam bude změněn a ekonomická interpretace regresních a korelačních koeficientů bude obtížná.

Při sestavování modelu je tedy jeden z kolineárních faktorů vyloučen na základě kvalitativní a logické analýzy nebo jsou počáteční faktory transformovány na nové, rozšířené. Kvalita a přiměřenost modelu k reálnému socioekonomickému jevu a procesu je dána optimalizací počtu faktorových znaků: čím více faktorů je zahrnuto, tím lépe model popisuje fenomén a proces, ale takový model je obtížně realizovatelný; s malým počtem faktorů, model není dostatečně adekvátní.

Problém výběru faktorových znaků a zmenšení rozměru modelu vícenásobné korelace je řešen na základě heuristických a vícerozměrných metod analýzy. Heuristické metody analýzy zahrnují metodu odborných hodnocení založenou na intuito-logických předpokladech a podstatné a kvalitativní analýze neparametrických indikátorů komunikační těsnosti: korelační koeficienty hodnosti, shoda. Nejčastěji používanou metodou je postupná regrese , která se skládá ze sekvenčního zahrnutí faktorů do modelu a hodnocení jejich významu.

Když se zavede faktor , určí se, kolik se sníží součet čtverců zbytků a zvýší se hodnota vícenásobného korelačního koeficientu R. Pokud je v modelu zahrnut faktor xk, hodnota R se zvyšuje a regresní koeficient ak se nemění nebo se mírně změní, pak je tento faktor významný a jeho začlenění do modelu nezbytné.

· Celkový počet studovaných indikátorů by měl být homogenní v závislosti na podmínkách tvorby účinných a faktorových znaků (rozlišené pozorování by měly být vyloučeny z celkového počtu);

· Výsledný atribut by měl dodržovat normální distribuční zákon, faktoriální by měl být blízko normální distribuce. Je-li objem agregátu dostatečně velký (n> 50), pak normálnost distribuce může být potvrzena na základě výpočtu a analýzy kritérií Pearson, Yastremsky, Kolmogorov, Boyarsky a dalších kritérií;

· Simulovaný jev nebo proces je popsán kvantitativně (parametry musí mít numerický výraz) jednou nebo několika rovnicemi příčinné souvislosti. Doporučuje se popsat příčinné souvislosti lineárními nebo blízkými lineárními formami závislosti;

· Konzistence územní a časové struktury studované populace, absence kvantitativních omezení modelových parametrů;

· Dostatečnost populačních jednotek : jejich počet by měl být několikrát větší než počet faktorů zahrnutých do modelu. Každý faktor by měl mít alespoň 5 až 6 pozorování, tj. počet faktorových příznaků by měl být 5 až 6krát nižší než objem studované populace.

Hlavní fáze korelační a regresní analýzy jsou:

· Předběžná teoretická analýza podstaty tohoto fenoménu, umožňující stanovení kauzálních vztahů mezi znaky, výběr nejdůležitějších faktorů, rozhodování o měření účinných a faktorických znaků;

· Příprava počátečních informací , včetně otázek týkajících se přiměřenosti pozorovacích jednotek, homogenity souboru studovaných charakteristik a blízkost jejich rozložení k normálu;

· Volba formy vztahu mezi vlastnostmi výkonu a faktory založenými na výčtu několika analytických funkcí;

· Studie o blízkosti vztahu mezi indikátorem výkonu a faktory, jakož i mezi faktory založenými na konstrukci matice párových lineárních korelačních koeficientů a projekcí mulko-lineárních faktorů;

· Výběr významných (významných) faktorů zahrnutých do multifactorního modelu - vícenásobná regresní rovnice, založená na odpovídajících statistických metodách;

· Výpočet parametrů vícenásobné regresní rovnice a hodnocení významnosti vybraných faktorů, korelační a regresní koeficienty s použitím kritérií t- Student a F- Fisher ;

· Analýza výsledků.

Vztahy mezi znaky jsou analyzovány zpravidla na základě pozorování vzorků proto, aby se ověřilo, že získané závislosti jsou spíše pravidelné než náhodné, odhaduje se významnost (významnost) korelačních a regresních indikátorů.

Analýza korelační a regresní analýzy se používá k vyhodnocení ukazatelů podnikatelského plánu a regulačních úrovní ekonomických ukazatelů, odrážejících efektivitu využívání výrobních zdrojů, zjišťování stávajících výrobních zásob, provádění srovnávací analýzy, posuzování potenciálních schopností podniků, krátkodobé prognózy vývoje výroby.

Vícenásobná regresní rovnice vám umožňuje najít teoretickou, možná hodnotu efektivního indikátoru pro určité hodnoty faktorových značek.

Parametry vícenásobné regresní rovnice jsou vypočteny metodou nejmenších čtverců založenou na řešení systému normálních rovnic. Pro lineární regresní rovnici s n faktory je systém vytvořen z (n + 1) normálních rovnic:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

Blízkost vztahu mezi studovanými parametry v případě vícenásobné korelace je určena na základě různých koeficientů.

Párované korelační koeficienty r měří blízkost lineárního vztahu mezi faktory a mezi výslednou značkou a každým zvažovaným faktorem bez ohledu na jejich vzájemnou interakci s jinými faktory.

Částečné korelační koeficienty charakterizují stupeň vlivu faktorů na výslednou známku, pokud jsou ostatní faktory fixovány na konstantní úrovni. V závislosti na počtu faktorů, jejichž vliv je vyloučen, mohou být dílčí korelační koeficienty prvního řádu (pokud je vyloučen vliv jednoho faktoru), druhého řádu (pokud jsou vyloučeny dva faktory) atd.

Parciální korelační koeficient prvního řádu mezi y a x 1 s vyloučením vlivu x 2 ve dvoufaktorovém modelu se vypočte podle vzorce: ,

kde r yx 1 , r yx 2 , r x1x2 - párové korelační koeficienty mezi odpovídajícími charakteristikami.

Kumulativní koeficient korelace, R, odhaduje blízkost vztahu mezi výsledným atributem a všemi faktory. Toto je hlavní ukazatel lineární vícenásobné korelace. U dvojfaktorového modelu je kumulativní koeficient více koeficientů vypočten podle vzorce:

. Kumulativní korelační koeficient R se pohybuje od 0 do 1. Čím menší jsou empirické hodnoty výsledné vlastnosti odlišné od těch, které se nacházejí podél víceúrovňové regresní linie, tím bližší korelační vztah mezi sledovanými parametry a kumulativním koeficientem korelace na jednotku.

Kumulativní koeficient vícenásobného stanovení , který se rovná R 2 , ukazuje, kolik variace výsledné vlastnosti je způsobeno vlivem faktorů zahrnutých do modelu.

Kumulativní index vícenásobné korelace charakterizuje blízkost vztahu mezi výslednou vlastností a všemi faktory s křivkovým vztahem:

= kde - rozptýlení výsledné vlastnosti pod vlivem faktorů zahrnutých do modelu; - zbytková disperze výsledného znaku způsobená vlivem faktorů, které model nezohledňuje. V lineární formě komunikace se kumulativní koeficient a index vícečetné korelace rovnají sobě navzájem.

Význam mnohopočetného korelačního koeficientu R je určen kritériem F - Fishera. Je určena vypočtenou hodnotou F calc , která je porovnána s tabulkovou hodnotou F crit . Koeficient vícenásobné korelace je považován za významný v závislosti na vztahu: F calc > F crit .

nebo ,

n je počet pozorování, m je počet parametrů rovnice.

F крит выбирается по таблице «Значение при заданном F – критерию Фишера при уровне значимости », a .

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: F расч > F крит .

Д л я фактора х 1 : ;

Для фактора х 2 : .





; Datum přidání: 2014-01-25 ; просмотров: 37877 ; Obsahuje publikovaný materiál autorská práva? |. | | Ochrana osobních údajů OBJEDNAT PRÁCI


Nenašli jste, co jste hledali? Vyhledávání pomocí:

Nejlepší slova: pro studenty týdne jsou dokonce i liché a platné. 8317 - |. | 6709 - nebo přečíst všechny ...

Viz též:

border=0
2019 @ edudoc.site

Generování stránek: 0.009 sec.