Տվյալների մայնինգ ընդդեմ OLAP
Եվ տվյալների արդյունահանումը և OLAP-ը բիզնեսի հետախուզության (BI) ընդհանուր տեխնոլոգիաներից երկուսն են: Բիզնես ինտելեկտը վերաբերում է բիզնեսի տվյալներից օգտակար տեղեկատվության նույնականացման և արդյունահանման համակարգչային մեթոդներին: Տվյալների հանքարդյունաբերությունը համակարգչային գիտության ոլորտն է, որը զբաղվում է տվյալների մեծ հավաքածուներից հետաքրքիր օրինաչափությունների արդյունահանմամբ: Այն միավորում է բազմաթիվ մեթոդներ՝ արհեստական ինտելեկտից, վիճակագրությունից և տվյալների բազայի կառավարումից: OLAP-ը (առցանց վերլուծական մշակում), ինչպես անունն է հուշում, բազմաչափ տվյալների շտեմարանների հարցումներ կատարելու եղանակների հավաքածու է:
Տվյալների արդյունահանումը հայտնի է նաև որպես տվյալների հայտնաբերում (KDD):Ինչպես նշվեց վերևում, դա համակարգչային գիտության ոլորտ է, որը զբաղվում է նախկինում անհայտ և հետաքրքիր տեղեկատվության արդյունահանմամբ հում տվյալներից: Տվյալների էքսպոնենցիալ աճի շնորհիվ, հատկապես այնպիսի ոլորտներում, ինչպիսին բիզնեսն է, տվյալների արդյունահանումը դարձել է շատ կարևոր գործիք՝ տվյալների այս մեծ պաշարը բիզնես ինտելեկտի վերածելու համար, քանի որ վերջին մի քանի տասնամյակներում օրինաչափությունների ձեռքով արդյունահանումը դարձել է անհնարին թվացող: Օրինակ, ներկայումս այն օգտագործվում է տարբեր ծրագրերի համար, ինչպիսիք են սոցիալական ցանցերի վերլուծությունը, խարդախության հայտնաբերումը և շուկայավարումը: Տվյալների հանքարդյունաբերությունը սովորաբար զբաղվում է հետևյալ չորս առաջադրանքներով՝ կլաստերավորում, դասակարգում, ռեգրեսիա և ասոցիացիա: Կլաստերավորումը նմանատիպ խմբերի նույնականացումն է չկառուցված տվյալներից: Դասակարգումը ուսուցման կանոններ է, որոնք կարող են կիրառվել նոր տվյալների նկատմամբ և սովորաբար ներառում են հետևյալ քայլերը՝ տվյալների նախնական մշակում, մոդելավորման ձևավորում, ուսուցում/հատկանիշների ընտրություն և գնահատում/վավերացում: Ռեգրեսիան տվյալների մոդելավորման համար նվազագույն սխալներով ֆունկցիաներ գտնելն է: Իսկ ասոցիացիան փնտրում է փոխհարաբերություններ փոփոխականների միջև:Տվյալների արդյունահանումը սովորաբար օգտագործվում է հարցերին պատասխանելու համար, ինչպիսիք են, թե որոնք են այն հիմնական արտադրանքները, որոնք կարող են օգնել Wal-Mart-ում հաջորդ տարի բարձր շահույթ ստանալ::
OLAP-ը համակարգերի դաս է, որոնք պատասխաններ են տալիս բազմաչափ հարցումներին: Սովորաբար OLAP-ն օգտագործվում է մարքեթինգի, բյուջետավորման, կանխատեսման և նմանատիպ ծրագրերի համար: Ակնհայտ է, որ OLAP-ի համար օգտագործվող տվյալների բազաները կազմաձևված են բարդ և ժամանակավոր հարցումների համար՝ նկատի ունենալով արագ կատարումը: Սովորաբար մատրիցն օգտագործվում է OLAP-ի ելքը ցուցադրելու համար: Տողերը և սյունակները ձևավորվում են հարցման չափերով: Նրանք հաճախ օգտագործում են մի քանի աղյուսակների ագրեգացման մեթոդներ՝ ամփոփումներ ստանալու համար: Օրինակ, կարելի՞ է օգտագործել այս տարվա վաճառքի մասին տեղեկանալ Wal-Mart-ում նախորդ տարվա համեմատ։ Ի՞նչ կանխատեսումներ կան հաջորդ եռամսյակի վաճառքների վերաբերյալ։ Ի՞նչ կարելի է ասել միտումի մասին՝ նայելով տոկոսային փոփոխությանը:
Չնայած ակնհայտ է, որ Data mining-ը և OLAP-ը նման են, քանի որ նրանք աշխատում են տվյալների վրա՝ բանականություն ձեռք բերելու համար, հիմնական տարբերությունը գալիս է նրանից, թե ինչպես են նրանք աշխատում տվյալների վրա:OLAP գործիքներն ապահովում են տվյալների բազմաչափ վերլուծություն և դրանք տրամադրում են տվյալների ամփոփումներ, սակայն, հակառակը, տվյալների հանքարդյունաբերությունը կենտրոնանում է տվյալների հավաքածուի գործակիցների, օրինաչափությունների և ազդեցությունների վրա: Սա OLAP գործարք է ագրեգացիայի հետ, որը հանգում է տվյալների գործարկմանը «ավելացման» միջոցով, բայց տվյալների արդյունահանումը համապատասխանում է «բաժանմանը»: Մյուս ուշագրավ տարբերությունն այն է, որ մինչ տվյալների արդյունահանման գործիքները մոդելավորում են տվյալները և վերադարձնում գործող կանոնները, OLAP-ը իրական ժամանակում կանցկացնի համեմատության և հակադրման տեխնիկան բիզնես հարթության երկայնքով: