FASTA-ի և FASTQ-ի հիմնական տարբերությունն այն է, որ FASTA-ն տեքստի վրա հիմնված ձևաչափ է, որը պահպանում է միայն նուկլեոտիդների կամ սպիտակուցների հաջորդականությունները, մինչդեռ FASTQ-ն տեքստի վրա հիմնված ձևաչափ է, որը պահպանում է և՛ հաջորդականությունը, և՛ հարակից հաջորդականության որակի արժեքները:
Կենսաինֆորմատիկան ոլորտ է, որն օգտագործում է տարբեր ծրագրեր՝ կենսաբանական տվյալները վերլուծելու և հասկանալու համար, հատկապես, երբ տվյալների հավաքածուն բարդ է և մեծ: Այս ոլորտը համատեղում է կենսաբանությունը, քիմիան, ֆիզիկան, համակարգչային գիտությունը, տեղեկատվական ճարտարագիտությունը, մաթեմատիկան և վիճակագրությունը՝ կենսաբանական տվյալները վերլուծելու և մեկնաբանելու համար: FASTA-ն և FASTQ-ը բիոինֆորմատիկայի ոլորտում հաջորդականության ներկայացման երկու ձևաչափեր են՝ հաջորդականությունները հավասարեցնելու և վերլուծելու համար:Փաստորեն, FASTQ-ը հաջորդականության ֆայլի ձևաչափ է, որն ընդլայնում է FASTA ձևաչափը՝ հաջորդականության որակը պահելու ունակությամբ:
Ի՞նչ է FASTA?
FASTA-ն ԴՆԹ-ի և սպիտակուցների հաջորդականության հավասարեցման ծրագիր է: FASTA ծրագիրը օգտագործում է FASTA ձևաչափը: Այն տեքստի վրա հիմնված ձևաչափ է, որը ներկայացնում է կա՛մ նուկլեոտիդային հաջորդականություն, կա՛մ ամինաթթուների (սպիտակուցների) հաջորդականություններ: Այստեղ մեկ տառային ծածկագրերը ներկայացնում են այս երկու հաջորդականությունը: FASTA-ն կարևոր գործիք է կենսաինֆորմատիկայի և կենսաքիմիայի ոլորտներում: Այս ձևաչափը թույլ է տալիս հաջորդականությունների անուններին և մեկնաբանություններին նախորդել հաջորդականություններին:
Նկար 01. FASTA հաջորդականություն
Այս ձևաչափը ծագել է FASTA ծրագրաշարից և ներդրվել է Դեյվիդ Ջ. Լիպմանի և Ուիլյամ Ռ. Փիրսոնի կողմից 1985 թվականին: FASTA գործիքը ժամանակի ընթացքում բազմաթիվ փոփոխություններ է կրել, և վերջին տարբերակը բաղկացած է ծրագրերից՝ սպիտակուցներ, ԴՆԹ::ԴՆԹ, սպիտակուց՝ թարգմանված ԴՆԹ (շրջանակների տեղաշարժերով) և պատվիրված կամ չպատվիրված պեպտիդների որոնումներ։FASTA-ն կարդում է տվյալ նուկլեոտիդային կամ ամինաթթուների հաջորդականությունը և փնտրում է համապատասխան հաջորդականության տվյալների բազան՝ օգտագործելով տեղական հաջորդականության հավասարեցում, որպեսզի գտնի տվյալների բազայի նմանատիպ հաջորդականությունների համընկնում:
Ի՞նչ է FASTQ
FASTQ-ը հավասարեցման ծրագիր է, որն օգտագործվում է կենսաինֆորմատիկայի ոլորտում, որը պահպանում է ինչպես կենսաբանական հաջորդականությունը (սովորաբար նուկլեոտիդային հաջորդականությունը), այնպես էլ դրա համապատասխան որակի միավորները: FASTQ-ն ի սկզբանե մշակվել է FASTA ձևաչափված հաջորդականությունը և համապատասխան որակի տվյալները միավորելու համար Wellcome Trust Sanger ինստիտուտի կողմից: Կենսաինֆորմատիկայի ոլորտում զարգացումով, FASTQ-ը դարձավ դե ֆակտո չափանիշ՝ շատ բարձր թողունակության հաջորդականության գործիքների ելքը պահելու համար:
FASTQ ձևաչափն օգտագործում է չորս տարբեր տող յուրաքանչյուր հաջորդականության համար: Տող 1-ը սկսվում է @ գրանշանով և հաջորդում է հաջորդականության նույնացուցիչը (նման է FASTA վերնագրի տողին): Տող 2-ը բաղկացած է չմշակված հաջորդական տառերից: 3-րդ տողում հաջորդականությունը սկսվում է «+» նիշով և կամայականորեն հաջորդում է նույն հաջորդականության նույնացուցիչը:Տող 4-ը կոդավորում է 2-րդ տողում նշված հաջորդականության որակի արժեքները և պետք է բաղկացած լինի նույն թվով նշաններից, ինչ տառերը հաջորդականության մեջ:
Որո՞նք են նմանությունները FASTA-ի և FASTQ-ի միջև:
- FASTA-ն և FASTQ-ը հավասարեցման գործիքներ են:
- Դրանք երկու հաջորդականության ներկայացման ձևաչափեր են:
- Երկուսն էլ առնչվում են կենսաինֆորմատիկայի ոլորտին։
- Եվ FAST-ը և FASTQ-ը կարևոր գործիքներ են պահպանման և հաջորդականության նպատակների համար:
- FASTQ-ը FASTA ձևաչափի ընդլայնումն է՝ հաջորդականության որակը պահելու ունակությամբ:
Ո՞րն է տարբերությունը FASTA-ի և FASTQ-ի միջև:
FASTA-ն տեքստի վրա հիմնված ձևաչափ է, որը պահպանում է միայն նուկլեոտիդների կամ սպիտակուցների հաջորդականությունները, մինչդեռ FASTQ-ն տեքստի վրա հիմնված ձևաչափ է, որը պահպանում է և՛ հաջորդականության, և՛ հարակից հաջորդականության որակի արժեքները: Այսպիսով, սա FASTA-ի և FASTQ-ի հիմնական տարբերությունն է: Ավելին, FASTA-ն պահում է հաջորդականության բեկորները քարտեզագրվելուց հետո, մինչդեռ FASTQ-ն պահում է հաջորդականության բեկորները քարտեզագրումից առաջ:Բացի այդ, FASTA-ի և FASTQ-ի ևս մեկ տարբերություն այն է, որ FASTA-ն բաղկացած է մեկ նկարագրության տողից, իսկ FASTAQ-ը՝ չորս տողից:
Ստորև բերված ինֆոգրաֆիկան ներկայացնում է FASTA-ի և FASTQ-ի տարբերությունները աղյուսակային տեսքով՝ կողք կողքի համեմատելու համար:
Ամփոփում – FASTA vs FASTQ
Կենսաինֆորմատիկան օգտագործում է հաջորդականությունների տարբեր ձևաչափեր, ինչպիսիք են FASTA և FASTQ և այլն: FASTA-ն պահում է հաջորդականության բեկորները քարտեզագրվելուց հետո, մինչդեռ FASTQ-ն պահում է հաջորդականության հատվածները նախքան քարտեզագրումը: FASTA-ն ԴՆԹ-ի և սպիտակուցների հաջորդականության հավասարեցման ծրագիր է: Այն բաղկացած է ծրագրերից՝ սպիտակուց՝ սպիտակուց, ԴՆԹ:ԴՆԹ, սպիտակուց՝ թարգմանված ԴՆԹ (շրջանակների տեղաշարժերով) և պատվիրված կամ չպատվիրված պեպտիդների որոնումների համար: FASTQ-ը հավասարեցման ծրագիր է, որն օգտագործվում է կենսաինֆորմատիկայի ոլորտում և պահպանում է ինչպես կենսաբանական հաջորդականությունը (սովորաբար նուկլեոտիդային հաջորդականությունը), այնպես էլ դրա համապատասխան որակի միավորները: FASTA-ն բաղկացած է մեկ նկարագրության տողից, իսկ FASTQ-ը՝ չորս տողից: Այսպիսով, սա ամփոփում է FASTA-ի և FASTQ-ի միջև եղած տարբերությունը: