Ռեգեսիա ընդդեմ հարաբերակցության
Վիճակագրության մեջ կարևոր է երկու պատահական փոփոխականների միջև կապի որոշումը: Այն հնարավորություն է տալիս կանխատեսումներ անել մեկ փոփոխականի վերաբերյալ մյուսների համեմատ: Ռեգրեսիոն վերլուծությունը և հարաբերակցությունը կիրառվում են եղանակի կանխատեսումների, ֆինանսական շուկայի վարքագծի, փորձերի միջոցով ֆիզիկական հարաբերությունների հաստատման և շատ ավելի իրական աշխարհի սցենարներում:
Ի՞նչ է ռեգրեսիան:
Ռեգեսիան վիճակագրական մեթոդ է, որն օգտագործվում է երկու փոփոխականների միջև կապը գծելու համար: Հաճախ, երբ տվյալները հավաքվում են, կարող են լինել փոփոխականներ, որոնք կախված են ուրիշներից:Այդ փոփոխականների միջև ճշգրիտ կապը կարող է հաստատվել միայն ռեգրեսիայի մեթոդներով: Այս հարաբերությունների որոշումն օգնում է հասկանալ և կանխատեսել մի փոփոխականի վարքագիծը մյուսի նկատմամբ:
Ռեգեսիոն վերլուծության ամենատարածված կիրառումը կախված փոփոխականի արժեքը գնահատելն է տվյալ արժեքի կամ անկախ փոփոխականների արժեքների միջակայքի համար: Օրինակ, ռեգրեսիայի միջոցով մենք կարող ենք կապ հաստատել ապրանքի գնի և սպառման միջև՝ հիմնվելով պատահական ընտրանքից հավաքված տվյալների վրա: Ռեգրեսիոն վերլուծությունը արտադրում է տվյալների հավաքածուի ռեգրեսիոն ֆունկցիա, որը մաթեմատիկական մոդել է, որը լավագույնս համապատասխանում է առկա տվյալներին: Սա հեշտությամբ կարելի է ներկայացնել ցրված սյուժեով: Գրաֆիկորեն, ռեգրեսիան համարժեք է տվյալ տվյալների հավաքածուի համար լավագույն պիտանի կորը գտնելուն: Կորի ֆունկցիան ռեգրեսիոն ֆունկցիան է։ Օգտագործելով մաթեմատիկական մոդելը՝ ապրանքի պահանջարկը կարելի է կանխատեսել տվյալ գնի համար։
Հետևաբար ռեգրեսիոն վերլուծությունը լայնորեն կիրառվում է կանխատեսման և կանխատեսման մեջ:Այն նաև օգտագործվում է փորձարարական տվյալների, ֆիզիկայի, քիմիայի և բազմաթիվ բնական գիտությունների ու ճարտարագիտական առարկաների հետ կապեր հաստատելու համար։ Եթե հարաբերությունը կամ ռեգրեսիոն ֆունկցիան գծային ֆունկցիա է, ապա գործընթացը հայտնի է որպես գծային ռեգրեսիա։ Ցրված սյուժեում այն կարող է ներկայացվել որպես ուղիղ գիծ: Եթե ֆունկցիան պարամետրերի գծային համակցություն չէ, ապա ռեգրեսիան ոչ գծային է։
Ի՞նչ է հարաբերակցությունը:
Կոռելացիան երկու փոփոխականների միջև կապի ուժի չափումն է: Հարաբերակցության գործակիցը քանակականացնում է մեկ փոփոխականի փոփոխության աստիճանը՝ հիմնվելով մյուս փոփոխականի փոփոխության վրա: Վիճակագրության մեջ հարաբերակցությունը կապված է կախվածության հասկացության հետ, որը վիճակագրական հարաբերությունն է երկու փոփոխականների միջև։
Պիրսոնի հարաբերակցության գործակիցը կամ պարզապես հարաբերակցության r գործակիցը արժեք է -1-ի և 1-ի միջև (-1≤r≤+1): Այն ամենից հաճախ օգտագործվող հարաբերակցության գործակիցն է և վավեր է միայն փոփոխականների միջև գծային հարաբերությունների համար:Եթե r=0, ապա հարաբերություն գոյություն չունի, իսկ եթե r≥0, ապա կապն ուղիղ համեմատական է. այսինքն՝ մի փոփոխականի արժեքը մեծանում է մյուսի աճի հետ։ Եթե r≤0, հարաբերությունը հակադարձ համեմատական է. այսինքն՝ մի փոփոխականը նվազում է, քանի որ մյուսը մեծանում է։
Գծայինության պայմանի պատճառով հարաբերակցության r գործակիցը կարող է օգտագործվել նաև փոփոխականների միջև գծային կապի առկայությունը հաստատելու համար:
Ո՞րն է տարբերությունը ռեգրեսիայի և հարաբերակցության միջև:
Ռեգեսիան տալիս է երկու պատահական փոփոխականների միջև կապի ձևը, իսկ հարաբերակցությունը տալիս է կապի ուժի աստիճանը:
Ռեգրեսիոն վերլուծությունը արտադրում է ռեգրեսիոն ֆունկցիա, որն օգնում է էքստրապոլյացնել և կանխատեսել արդյունքները, մինչդեռ հարաբերակցությունը կարող է տեղեկատվություն տրամադրել միայն այն մասին, թե որ ուղղությունը կարող է փոխվել:
Վերլուծության միջոցով տրված են գծային ռեգրեսիայի ավելի ճշգրիտ մոդելներ, եթե հարաբերակցության գործակիցն ավելի բարձր է: (|r|≥0.8)