Տարբերությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև

Բովանդակություն:

Տարբերությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև
Տարբերությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև

Video: Տարբերությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև

Video: Տարբերությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև
Video: Overview of Orthostatic Intolerance 2024, Հուլիսի
Anonim

Հիմնական տարբերություն – Վերահսկվող ընդդեմ չվերահսկվող մեքենայական ուսուցման

Վերահսկվող ուսուցումը և չվերահսկվող ուսուցումը մեքենայական ուսուցման երկու հիմնական հասկացություններն են: Վերահսկվող ուսուցումը մեքենայական ուսուցման խնդիր է՝ սովորելու գործառույթ, որը մուտքագրում է ելքային մուտքագրումը՝ հիմնվելով մուտքային-ելքային զույգերի օրինակի վրա: Չվերահսկվող ուսուցումը մեքենայական ուսուցման խնդիրն է՝ եզրակացնելու գործառույթ, որը նկարագրում է թաքնված կառուցվածքը չպիտակավորված տվյալներից: Վերահսկվող և չվերահսկվող մեքենայական ուսուցման հիմնական տարբերությունն այն է, որ վերահսկվող ուսուցումն օգտագործում է պիտակավորված տվյալներ, մինչդեռ չվերահսկվող ուսուցումն օգտագործում է չպիտակավորված տվյալներ։

Մեքենայական ուսուցումը համակարգչային գիտության բնագավառ է, որը համակարգչային համակարգին հնարավորություն է տալիս սովորել տվյալներից՝ առանց հստակ ծրագրավորման:Այն թույլ է տալիս վերլուծել տվյալները և կանխատեսել դրանցում առկա օրինաչափությունները: Մեքենայի ուսուցման բազմաթիվ կիրառություններ կան: Դրանցից մի քանիսն են դեմքի ճանաչումը, ժեստերի ճանաչումը և խոսքի ճանաչումը: Գոյություն ունեն մեքենայական ուսուցման հետ կապված տարբեր ալգորիթմներ: Դրանցից մի քանիսն են ռեգրեսիան, դասակարգումը և կլաստերավորումը: Ամենատարածված ծրագրավորման լեզուները մեքենայական ուսուցման վրա հիմնված հավելվածներ մշակելու համար R-ն և Python-ն են: Կարող են օգտագործվել նաև այլ լեզուներ, ինչպիսիք են Java, C++ և Matlab:

Ի՞նչ է վերահսկվող ուսուցումը:

Մեքենայական ուսուցման վրա հիմնված համակարգերում մոդելն աշխատում է ըստ ալգորիթմի: Վերահսկվող ուսուցման ժամանակ մոդելը վերահսկվում է: Նախ, անհրաժեշտ է վարժեցնել մոդելը: Ձեռք բերված գիտելիքներով այն կարող է գուշակել ապագա ատյանների պատասխանները։ Մոդելը վերապատրաստվում է պիտակավորված տվյալների բազայի միջոցով: Երբ համակարգին տրվում է նմուշի տվյալներից դուրս, այն կարող է կանխատեսել արդյունքը: Ստորև ներկայացված է IRIS հանրաճանաչ տվյալների բազայի մի փոքր հատված:

Տարբերությունը վերահսկվող և չվերահսկվող ուսուցման միջև_Նկար 02
Տարբերությունը վերահսկվող և չվերահսկվող ուսուցման միջև_Նկար 02

Համաձայն վերոհիշյալ աղյուսակի, Sepal length, Sepal width, Patel length, Patel width և Species կոչվում են ատրիբուտներ։ Սյունակները հայտնի են որպես հատկանիշներ: Մեկ տողում կան տվյալներ բոլոր հատկանիշների համար: Հետեւաբար, մեկ տողը կոչվում է դիտարկում: Տվյալները կարող են լինել կամ թվային կամ դասակարգային: Մոդելին տրվում են դիտարկումները՝ որպես մուտքագրում համապատասխան տեսակի անվանումը: Երբ տրվում է նոր դիտարկում, մոդելը պետք է կանխատեսի այն տեսակների տեսակը, որին պատկանում է:

Վերահսկվող ուսուցման մեջ կան դասակարգման և ռեգրեսիայի ալգորիթմներ: Դասակարգումը պիտակավորված տվյալների դասակարգման գործընթացն է: Մոդելը ստեղծեց սահմաններ, որոնք առանձնացնում էին տվյալների կատեգորիաները: Երբ մոդելին տրամադրվում են նոր տվյալներ, այն կարող է դասակարգել՝ հիմնվելով կետի առկայության վրա:K-Nearest Neighbors-ը (KNN) դասակարգման մոդել է: Կախված k արժեքից՝ որոշվում է կատեգորիան։ Օրինակ, երբ k-ը 5-ն է, եթե տվյալ տվյալների կոնկրետ կետը մոտ է ութ տվյալների կետին A կատեգորիայում և վեց տվյալների կետին B կատեգորիայում, ապա տվյալների կետը կդասակարգվի որպես A::

Ռեգեսիան նախորդ տվյալների միտումների կանխատեսման գործընթացն է՝ նոր տվյալների արդյունքը կանխատեսելու համար: Ռեգրեսիայի դեպքում ելքը կարող է բաղկացած լինել մեկ կամ մի քանի շարունակական փոփոխականներից: Կանխատեսումը կատարվում է օգտագործելով տող, որն ընդգրկում է տվյալների կետերի մեծ մասը: Ամենապարզ ռեգրեսիոն մոդելը գծային ռեգրեսիան է: Այն արագ է և չի պահանջում թյունինգի պարամետրեր, ինչպիսիք են KNN-ում: Եթե տվյալները ցույց են տալիս պարաբոլիկ միտում, ապա գծային ռեգրեսիայի մոդելը հարմար չէ:

Տարբերությունը վերահսկվող և չվերահսկվող ուսուցման միջև
Տարբերությունը վերահսկվող և չվերահսկվող ուսուցման միջև

Սրանք վերահսկվող ուսուցման ալգորիթմների մի քանի օրինակներ են: Ընդհանուր առմամբ, վերահսկվող ուսուցման մեթոդներից ստացված արդյունքներն ավելի ճշգրիտ և հուսալի են, քանի որ մուտքագրված տվյալները լավ հայտնի են և պիտակավորված: Հետևաբար, մեքենան պետք է վերլուծի միայն թաքնված նախշերը:

Ի՞նչ է չվերահսկվող ուսուցումը:

Չվերահսկվող ուսուցման դեպքում մոդելը չի վերահսկվում: Մոդելը աշխատում է ինքնուրույն՝ կանխատեսելու արդյունքները: Այն օգտագործում է մեքենայական ուսուցման ալգորիթմներ՝ չպիտակավորված տվյալների վերաբերյալ եզրակացությունների գալու համար: Ընդհանուր առմամբ, չվերահսկվող ուսուցման ալգորիթմներն ավելի դժվար են, քան վերահսկվող ուսուցման ալգորիթմները, քանի որ քիչ տեղեկատվություն կա: Կլաստերավորումը չվերահսկվող ուսուցման տեսակ է: Այն կարող է օգտագործվել ալգորիթմների միջոցով անհայտ տվյալները խմբավորելու համար: K-միջին և խտության վրա հիմնված կլաստերավորումը երկու կլաստերավորման ալգորիթմներ են:

k-միջին ալգորիթմ, յուրաքանչյուր կլաստերի համար պատահականորեն տեղադրում է k ցենտրոիդը: Այնուհետև յուրաքանչյուր տվյալների կետ վերագրվում է ամենամոտ ցենտրոիդին: Էվկլիդյան հեռավորությունը օգտագործվում է տվյալների կետից մինչև կենտրոնական հեռավորությունը հաշվարկելու համար: Տվյալների կետերը դասակարգվում են խմբերի: Կրկին հաշվարկվում են k ցենտրոիդների դիրքերը: Կենտրոնի նոր դիրքը որոշվում է խմբի բոլոր կետերի միջինով: Կրկին յուրաքանչյուր տվյալների կետ վերագրվում է ամենամոտ ցենտրոիդին:Այս պրոցեսը կրկնվում է այնքան ժամանակ, մինչև կենտրոնական կետերն այլևս չփոխվեն: k-mean-ը արագ կլաստերավորման ալգորիթմ է, սակայն խմբավորման կետերի հստակ սկզբնավորում չկա: Բացի այդ, կա կլաստերի մոդելների մեծ տատանումներ, որոնք հիմնված են կլաստերի կետերի սկզբնավորման վրա:

Կլաստերավորման մեկ այլ ալգորիթմ խտության վրա հիմնված կլաստերավորումն է: Այն նաև հայտնի է որպես աղմուկով խտության վրա հիմնված տարածական կլաստերի հավելվածներ: Այն աշխատում է՝ կլաստերը սահմանելով որպես խտությամբ միացված կետերի առավելագույն հավաքածու: Դրանք երկու պարամետր են, որոնք օգտագործվում են խտության վրա հիմնված կլաստերավորման համար: Դրանք Ɛ (էպսիլոն) և նվազագույն միավորներ են։ Ɛ-ը հարևանության առավելագույն շառավիղն է: Նվազագույն միավորները Ɛ հարևանությամբ միավորների նվազագույն քանակն են՝ կլաստերը սահմանելու համար: Սրանք խմբավորման որոշ օրինակներ են, որոնք ընկնում են չվերահսկվող ուսուցման մեջ:

Ընդհանրապես, չվերահսկվող ուսուցման ալգորիթմներից ստացված արդյունքներն այնքան էլ ճշգրիտ և հուսալի չեն, քանի որ մեքենան պետք է սահմանի և պիտակավորի մուտքային տվյալները՝ նախքան թաքնված օրինաչափությունները և գործառույթները որոշելը:

Ո՞րն է նմանությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև:

Եվ վերահսկվող և չվերահսկվող ուսուցումը մեքենայական ուսուցման տեսակներ են:

Ո՞րն է տարբերությունը վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև:

Վերահսկվող ընդդեմ մեքենայական ուսուցման չվերահսկվող

Վերահսկվող ուսուցումը մեքենայական ուսուցման խնդիրն է՝ սովորելու գործառույթ, որը մուտքագրում է ելքային մուտքը ելքի վրա՝ հիմնվելով օրինակ մուտքագրման-ելքի զույգերի վրա: Unsupervised Learning-ը մեքենայական ուսուցման խնդիրն է՝ չպիտակավորված տվյալներից թաքնված կառուցվածքը նկարագրելու ֆունկցիայի եզրակացություն:
Հիմնական գործառույթ
Վերահսկվող ուսուցման ժամանակ մոդելը կանխատեսում է արդյունքը պիտակավորված մուտքային տվյալների հիման վրա: Չվերահսկվող ուսուցման ժամանակ մոդելը կանխատեսում է արդյունքը առանց պիտակավորված տվյալների՝ ինքնուրույն բացահայտելով օրինաչափությունները:
Արդյունքների ճշգրտություն
Վերահսկվող ուսուցման մեթոդներից ստացված արդյունքներն ավելի ճշգրիտ և հուսալի են: Չվերահսկվող ուսուցման մեթոդներից ստացված արդյունքներն այնքան էլ ճշգրիտ և հուսալի չեն:
Հիմնական ալգորիթմներ
Գոյություն ունեն ռեգրեսիայի և դասակարգման ալգորիթմներ վերահսկվող ուսուցման մեջ: Առանց վերահսկման ուսուցման մեջ կան խմբավորման ալգորիթմներ:

Ամփոփում – Վերահսկվող ընդդեմ չվերահսկվող մեքենայական ուսուցման

Վերահսկվող ուսուցումը և չվերահսկվող ուսուցումը մեքենայական ուսուցման երկու տեսակ են:Վերահսկվող ուսուցումը մեքենայական ուսուցման խնդիրն է՝ սովորելու մի ֆունկցիա, որը մուտքագրում է ելքային մուտքագրումը՝ հիմնվելով օրինակ մուտքային-ելքային զույգերի վրա: Չվերահսկվող ուսուցումը մեքենայական ուսուցման խնդիրն է՝ եզրակացնելու ֆունկցիա՝ չպիտակավորված տվյալներից թաքնված կառուցվածքը նկարագրելու համար: Վերահսկվող և չվերահսկվող մեքենայական ուսուցման միջև տարբերությունն այն է, որ վերահսկվող ուսուցումն օգտագործում է պիտակավորված տվյալներ, մինչդեռ չվերահսկվող թեքումը՝ չպիտակավորված տվյալներ։

Խորհուրդ ենք տալիս: