Վարիանս ընդդեմ կովարիանս
Վարիանսը և կովարիանսը վիճակագրության մեջ օգտագործվող երկու չափումներ են: Վարիանսը տվյալների ցրվածության չափումն է, իսկ կովարիանսը ցույց է տալիս երկու պատահական փոփոխականների փոփոխության աստիճանը միասին: Տարբերությունը ավելի շուտ ինտուիտիվ հասկացություն է, բայց կովարիանսը սկզբում մաթեմատիկորեն սահմանվում է ոչ այնքան ինտուիտիվ:
Ավելին Variance-ի մասին
Վիանսը բաշխման միջին արժեքից տվյալների ցրման չափումն է: Այն ցույց է տալիս, թե որքան հեռու են տվյալների կետերը բաշխման միջինից: Այն հավանականությունների բաշխման առաջնային բնութագրիչներից է և բաշխման պահերից մեկը։Նաև դիվերանսը պոպուլյացիայի պարամետրն է, և պոպուլյացիայից ընտրանքի շեղումը գործում է որպես պոպուլյացիայի շեղումների գնահատող: Մի տեսանկյունից այն սահմանվում է որպես ստանդարտ շեղման քառակուսի:
Հասարակ լեզվով այն կարելի է նկարագրել որպես յուրաքանչյուր տվյալների կետի և բաշխման միջինի միջև հեռավորության քառակուսիների միջին: Տարբերությունը հաշվարկելու համար օգտագործվում է հետևյալ բանաձևը.
Var(X)=E[(X-µ)2] բնակչության համար, և
Var(X)=E[(X-‾x)2] նմուշի համար
Այն կարող է ավելի պարզեցվել՝ տալով Var(X)=E[X2]-(E[X])2:
Վարիանսն ունի որոշ ստորագրության հատկություններ և հաճախ օգտագործվում է վիճակագրության մեջ՝ օգտագործումն ավելի պարզ դարձնելու համար: Տարբերությունը ոչ բացասական է, քանի որ այն հեռավորությունների քառակուսին է: Այնուամենայնիվ, տատանումների շրջանակը սահմանափակված չէ և կախված է որոշակի բաշխումից: Մշտական պատահական փոփոխականի շեղումը զրոյական է, իսկ դիստրիանսը չի փոխվում տեղորոշման պարամետրի նկատմամբ:
Ավելին Covariance մասին
Վիճակագրական տեսության մեջ կովարիանսը չափում է, թե որքանով են փոխվում երկու պատահական փոփոխականները միասին: Այլ կերպ ասած, կովարիանսը երկու պատահական փոփոխականների միջև հարաբերակցության ուժի չափումն է: Նաև այն կարելի է համարել որպես երկու պատահական փոփոխականների շեղումների հայեցակարգի ընդհանրացում։
Երկու X և Y պատահական փոփոխականների կովարիանսը, որոնք համատեղ բաշխված են վերջավոր երկրորդ իմպուլսով, հայտնի է որպես σXY=E[(X-E[X])(Y-E[Y])]. Սրանից շեղումը կարող է դիտվել որպես կովարիանսի հատուկ դեպք, որտեղ երկու փոփոխականները նույնն են: Cov(X, X)=Var(X)
Կովարիանսը նորմալացնելով կարելի է ստանալ գծային հարաբերակցության գործակիցը կամ Պիրսոնի հարաբերակցության գործակիցը, որը սահմանվում է որպես ρ=E[(X-E[X])(Y-E[Y])]/(σ): X σY)=(Cov(X, Y))/(σX σY )
Գրաֆիկորեն, տվյալների զույգ կետերի միջև կովարիանսը կարող է դիտվել որպես ուղղանկյան տարածք՝ հակառակ գագաթներում գտնվող տվյալների կետերի հետ:Այն կարող է մեկնաբանվել որպես տվյալների երկու կետերի միջև տարանջատման մեծության չափանիշ: Հաշվի առնելով ուղղանկյունները ամբողջ պոպուլյացիայի համար՝ բոլոր տվյալների կետերին համապատասխան ուղղանկյունների համընկնումը կարելի է համարել որպես տարանջատման ուժ. երկու փոփոխականների տարբերություն. Կովարիանսը երկու հարթության մեջ է, քանի որ երկու փոփոխական է, բայց այն պարզեցնելով մեկ փոփոխականի, տալիս է սինգլի շեղումը որպես մեկ չափման տարանջատում:
Ո՞րն է տարբերությունը Variance-ի և Covariance-ի միջև:
• Վարիանսը պոպուլյացիայի մեջ տարածման/ցրվածության չափումն է, մինչդեռ կովարիանսը դիտարկվում է որպես երկու պատահական փոփոխականների փոփոխության կամ հարաբերակցության ուժի չափում:
• Վարիանսը կարելի է դիտարկել որպես կովարիանսի հատուկ դեպք:
• Վարիանսը և կովարիանսը կախված են տվյալների արժեքների մեծությունից և չեն կարող համեմատվել; հետեւաբար դրանք նորմալացվում են։ Կովարիանսը նորմալացվում է հարաբերակցության գործակցի մեջ (բաժանվում է երկու պատահական փոփոխականների ստանդարտ շեղումների արտադրյալով), իսկ շեղումը նորմալացվում է ստանդարտ շեղման (վերցնելով քառակուսի արմատը)