نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی دکتری گروه زراعت و اصلاح نباتات پردیس کشاورزی و منابع طبیعی دانشگاه تهران
2 استاد گروه زراعت و اصلاح نباتات پردیس کشاورزی و منابع طبیعی دانشگاه تهران
3 استاد گروه بیوتکنولوژی پردیس کشاورزی و منابع طبیعی دانشگاه تهران
4 دانشیار گروه زراعت و اصلاح نباتات پردیس کشاورزی و منابع طبیعی دانشگاه تهران
چکیده
کلیدواژهها
عنوان مقاله [English]
نویسندگان [English]
Ferula gummosa Boiss is a herbaceous plant from the Apiaceae family that is indigenous to East and West of Iran. Galbanum is an oleo-gum-resin with high pharmaceutical and industrial values, which is exuded from F. gummosa in response to wounds. Although galbanum ranks first in terms of Iranian export of pasture medicinal plants, little information exists on the genetic and biochemical mechanisms of these compounds are existed. In this regard, transcriptomics studies of medicinal plants have much to contribute to this field of science. RNA-Seq techniques are now one of the most used and most accurate methods in transcriptomics. In the present study, RNA-Seq was used to evaluate the root and flower of F. gummosa transcriptome. Short reads obtained from Illumina HiSeq2000 were assembled by Trinity software after trimming and filtering for quality scores below 30. The assembled transcriptome with 158,436 transcripts and N50 1,348 bp was annotated using different databases such as NCBI nr-proteins, Plant sub-database of NCBI nr-proteins, Swiss-Prot, TAIR10 and PLAZA 3. In total, 100,275 transcripts were annotated using BLASTX with an E-value cut-off of 10-5. Gene ontology (GO) classification of annotated transcripts was done by Blast2Go and Trinotate pipeline and in total 73,678 transcripts with at least one GO were identified. In terms of biological processes, cellular and metabolic processes are the most GO terms (44.55 %) indicated that the plant is in a metabolically active status. Transcriptome assessment of orthologous genes by NCBI-KOG database led to the identification of 42,452 genes from 3,925 families and 26 functional classes. The largest class of orthologous genes was associated with signal transduction mechanisms (14.29 %), followed by other classes, such as secondary metabolites-transport and catabolism with a frequency of 4.25 % (1,806 transcripts) indicating the most active status of F. gummosa roots and flowers for secondary metabolite production and transportation.
کلیدواژهها [English]
گیاهان دارویی یکی از مهمترین منابع امیدوارکننده برای تولید انواع داروها و همچنین درمان انواع بیماریها محسوب می شوند. به گونهای که تاکنون بسیاری از ترکیبات دارویی مهم و فعال از منابع گیاهی مختلف استخراج و مورد استفاده قرار گرفته است (Julsing et al., 2008) با این وجود، در برخی موارد معرفی منابع اولیه برای تولید چنین ترکیبات دارویی (در مقیاس وسیع و بصورت پایدار) با برخی چالشها و مشکلاتی همراه بوده است (Sarfaraj Hussain et al., 2012). ایران به عنوان کشوری غنی از نظر پوشش و تنوع گیاهان دارویی، رویشگاه گیاهانی میباشد که جنبه های دارویی آنها به اثبات رسیده است، ولی مطالعات مولکولی و بیوشیمیایی کمتر روی آنها صورت گرفته است.
گیاه باریجه با نام علمی Ferula gummosa Boiss از تیره چتریان، Apiaceae، بومی مناطق شرق و غرب ایران است و در استانهایی نظیر سمنان، خراسان، اصفهان، فارس و استانهای مرکزی کشور پراکنده شده است
(Shahbazi et al., 2011). این گیاه علفی، چندساله و مونوکارپیک است که در سال آخر رویش (سال پنجم تا هشتم) به ساقه میرود و تشکیل گل و میوه میدهد. هرگونه خراش و یا گزش در ریشه و یا ساقه منجر به خروج شیرابه میگردد (Ghannadi & Amree, 2002). در طب سنتی این گیاه به منظور تسکین دردها، درمان بیماریهای داخلی و به عنوان ضدعفونی کننده زخمها مورد استفاده قرار میگرفته است. مطالعات مختلف، اثرات دارویی این گیاه را تأیید کردهاند (Abbaszadegan et al., 2015; Seyed et al., 2010). در همین راستا مطالعات ترانسکریپتومیکس کمک بسیاری به این زمینه از علم گیاهان دارویی کردهاند. به طوری که بسیاری از گیاهان دارویی مهم دنیا به منظور شناسایی رابطه بین ترکیبات ارزشمند و ژنهای مرتبط با بیوسنتز آنها تحت مطالعه قرار گرفتهاند (Colebatch et al., 2004; Yang et al., 2009; Zulak et al., 2007). تکنیک RNA-Seq که در حال حاضر جزو پر کاربردترین و دقیقترین روشهای ترانسکریپتومیکس به شمار میرود ابزاری است که میتواند با راندمان بالا روابط ذکر شده بین ژنهای مرتبط با ترکیبات ارزشمند را کشف کند (Spyropoulou et al., 2014; Tang et al., 2011).
طی سالهای اخیر مطالعات بسیار زیادی از روش RNA-seq برای پی بردن به مکانیسم پیچیده مقاومتها و متابولیسم ترکیبات مؤثره گیاهان دارویی استفاده کردهاند. کراری و همکاران با مطالعه روی پروفایل متابولیتی و پروفایل بیان ژن گوجه فرنگی در مراحل مختلف رشد، موفق به شناسایی رفتارهای ژنها طی فرایند رسیدن گوجه فرنگی شدند و از این طریق ژنهای درگیر در مسیر بیوسنتز لیکوپن در گوجه فرنگی را مورد مطالعه قرار دادند (Carrari et al., 2006). شی و همکاران با همین روش ژنهای کاندید مسیرهای بیوسنتز متابولیتهای مهم چای را مورد بررسی قرار دادند (Shi et al., 2011). گوپتا و همکاران با همین روش متابولیسم فلاونویید های بلوبری را مورد مطالعه قرار دادند (Gupta et al., 2015). وایدیا و همکاران با استفاده از این تکنیک ها ژنهای درگیر در مسیر بیوسنتز دیاسژنین را شناسایی کردند(Vaidya et al., 2013). کیونگ هیون و همکاران با اندازه گیری پروفایل متابولیت های توت سیاه در مراحل مختلف و تلفیق داده ها با پروفایل RNA-Seq آن، موفق به شناسایی ژنهای درگیر در بیوسنتز آنتوسیانینهای توت سیاه شدند (Hyun et al., 2014). چندین پروژه دیگر، ژنهای درگیر در مسیرهای متابولیسمی کارتنوئیدها، آلکالوئیدها، فلاونوئیدها، ترپنوئیدها و بطور کلی متابولیتهای ثانویه را مورد مطالعه قرار دادهاند.
یا توجه به فقدان دادههای مولکولی روی این گونه و دیگر گونههای بومی از خانواده چتریان لزوم انجام تحقیقات ژنومیکس و ترانسکریپتومیکس بیش از پیش ضروری بنظر میرسد (تا
مواد و روشها
نمونهبرداری
نمونه های گیاهی تحقیق حاضر در خرداد 1393 از ارتفاعات روستای شهرستانک واقع در جاده چالوس در ارتفاع 2200 متری از سطح دریا، عرض جغرافیایی 35 درجه، 58 دقیقه و 10 ثانیه شمالی و طول جغرافیایی 51 درجه، 21 دقیقه و 13 ثانیه شرقی جمع آوری شدند. از آنجا که ریشه و گل از نظر تولید ترپنها (بخش قابل توجه شیرابه باریجه) فعالیت بالایی دارند، این دو اندام جهت مطالعات ترانسکریپتوم مورد استفاده قرار گرفتند. نمونههای گل و ریشه از یک گیاه سالم به طول تقریبی 120 سانتی متر، در اواخر مرحله گلدهی (قبل از ریزش گلبرگهای زرد) گرفته شده و با کمک مرکز ملی ذخایر ژنتیک از نظر گیاه شناسی مورد تأیید قرار گرفتند. دو اندام ریشه و گل گیاه بطور جدا گانه با ازت مایع فریز شدند و برای مراحل بعدی کار در دمای 20- درجه سانتیگراد نگهداری شدند.
استخراج و ارزیابی RNA
اولین مرحله در آنالیز ترانسکریپتوم استخراج RNA با کیفیت و کمیت مناسب میباشد. از آنجا که باریجه گیاهی چند ساله با ریشه های چوبی و چوب پنبهای همراه با شیرابه زیاد میباشد، استخراج RNA با کیفیت از اندامهای مختلف آن بخصوص ریشه بسیار سخت و وقتگیر میباشد. در این تحقیق روشهای مختلف استخراج RNA از جمله استفاده از کیتهای ستونی و کیتهای رسوبی از جمله ترایزول و بایوزول و روشهای دستی مورد ارزیابی قرار گرفتند که از بین این روشها روش استفاده از کیت بایوزول (BioFlux) بهترین و موثرترین روش بوده است (Johnson et al., 2012). RNA استخراج شده با دستگاههای نانودراپ 2000، بایوآنالیزر 2100 و الکتروفورز ژل آگارز مورد ارزیابی قرار گرفت.
ساخت کتابخانه cDNA و توالییابی
اولین مرحله در تولید یک کتابخانه cDNA، جداسازی mRNAی کل از یک نوع سلول یا بافت مورد نظر است. از آنجا که جهت جداسازی آنها از rRNA ها و tRNA های موجود در سلول از زنجیره کوتاهی از تیمیدیلات (الیگوdT) متصل به بستر ستون کروماتوگرافی؛ استفاده شد. پس از جداسازی mRNAها و ساخت cDNA دو رشتهای، در نهایت کتابخانه cDNA توسط دستگاه Illumina HiSeqTM 2000 با استفاده از فناوری Paired-end با طول قرائت 150 نوکلئوتید طبق دستورالعمل کمپانی BGI توالییابی شدند.
تعیین کیفیت و مونتاژ خوانشها
نتایج حاصل از دستگاه توالی یابی Illumina 2000TM HiSeq خوانشهای خام نامیده میشوند که در قالب فایل فستکیو ذخیره میشوند. داده خام حاوی خوانشهای نامطلوبی است که می تواند در آنالیزهای بیوانفورماتیکی بعدی اثر منفی داشته باشند. بنابراین توالیها با معیار Q20 (معیاری برای سنجش کیفیت توالیها)، سنجیده شده و توالیهای خام با کیفیت مناسب برای مونتاژ استفاده شدند. لازم به ذکر است که فایلهای حاوی خوانشهای ریشه و گل به صورت جدا گانه در قسمت آرشیو خوانشهای توالیهای (SRA) سایت NCBI ثبت شدند (
نرم افزار Trinity v2.2.0 روی یک کامپیوتر سرور با رم 256 گیگا بایت و دارای 24 هسته سی پی یو 2 گیگاهرتزی و سیستم عامل لینوکس اوبونتو برای مونتاژ این خوانشهای خام استفاده گردید (Haas et al., 2013). جهت بررسی ترانسکریپتوم حاصل، تعداد ترانسکریپت و یونی ژن مونتاژ شده، میانگین طول آنها و N50 با نرم افزار Trinitystats.pl محاسبه شدند. و ترانسکریپتوم مونتاژ شده جهت تعیین کیفیت مونتاژ، با نرم افزار Transrate مورد ارزیابی قرار گرفت (Li et al., 2014).
تفسیر عملکردی ترانسکریپتوم
ترانسکریپتوم باریجه توسط نرمفزارهای مختلف از جمله Blast2GO و +BLAST با دیتابیسهایی چون NCBI-nr proteins، Plaza 3.0، Swiss-Prot، TAIR10، PlantCyc و KEGG همردیفی شدند تا توالیهای مشابه با آنها شناسایی شوند . BLASTX با حدآستانهی (E-value ≤ 10-5) برای تفسیر عملکردی ترانسکریپتوم با دیتابیسهای مذکور استفاده گردید. از آنجا که دیتابیس nr دارای حجم بسیار زیادی میباشد برای بلاست با این دیتابیس از کامپیوتر سرور با 24 هسته سی پی یو استفاده شد. از آنجا که بلاست nr کاری زمان بر است در این تحقیق سعی شد راندمان بلاست با زیر مجموعه گیاهی nr نیز مورد ارزیابی قرار بگیرد. نتایج حاصل از بلاست با دیتابیسهای مختلف توسط نرمافزار R با هم مقایسه گردید(Correa & Silva, 2011).
ارزیابی GO و KOG ترانسکریپتوم
آنالیز GO کل ترانسکریپتوم با نرمافزارهای Trinotate، Funrich و Blast2Go انجام گرفت و بدین ترتیب کلیه یونیژنهای دارای GO شناسایی شده و دسته بندی آنها در سه دسته Biological process، Molecular function و Cellular component در نرمافزارهای R و Exell انجام گرفت (Inglis et al., 2013; Supek et al., 2011). آنالیز KOG از طریق بلاست (rpsBLAST) ترانسکریپتوم با دیتابیس KOG وبسایت NCBI انجام گرفت. نتایج بلاست با فایل حاوی اطلاعات تکاملی ژنها داده کاوی گردید و یونیژنها در گروههای ارتولوگ دسته بندی شدند (Annadurai et al., 2012).
نتایج و بحث
استخراج و ارزیابی کیفی و کمی RNA
همانطور که اشاره گردید در این آزمایش روشهای مختلفی برای استخراج RNA استفاده گردید که به دلیل خاصیت رزینی و فنولی اندامهای باریجه، بخصوص ریشه، اکثر آنها با شکست مواجه گردید. در نهایت استخراج با روش بایوزول انجام گرفت و نتایج مطلوب حاصل گردید. در این آزمایش سعی شد RNA بدست آمده کیفیت و کمیت مطلوبی داشته باشد و در نهایت برای توالی یابی و سنتز cDNA از RNA هایی استفاده شد که نسبت 260 به 280 بیشتر از 2، نسبت 260 به 230 بیشتر از 8/1 (NanoDrop-2000)، نسبت RNA ریبوزومی s 28 به s 18 بیشتر از 5/1 (الکتروفورز رو ژل آگارز 1 درصد) و اینتگریتی (RIN) بیشتر از 8 (بایو آنالیزر با دستگاه Agilent Bioanalyzer-2100) باشند. نمونه ای از عکس ژل الکتروفورز و نتایج بایوآنالیزر RNA های استفاده شده برای دو اندام ریشه و گل باریجه در شکل 1آورده شده است.
توالییابی، ارزیابی خوانشها و مونتاژ ترانسکریپتوم
جهت توالی یابی RNA از روش ساخت کتابخانه cDNA با روش oligo-dT استفاده گردید. جهت توالی یابی ترانسکریپتوم از دستگاه Illumina HiSeq2000 استفاده گردید که از نظر تولید خوانشهای با کمیت و کیفیت بالا بسیار مطلوب میباشد. از آنجا که برای باریجه ژنوم رفرنسی وجود نداشت و توالییابی RNAی آن نیز برای بار اول انجام میگرفت، استفاده از پایپ لاین مونتاژ از نو جهت بازسازی ترانسکریپتوم و آنالیزهای بعدی اجتناب ناپذیر بود. که در این موارد هر چه طول و تعداد خوانشها بیشتر باشند بهتر است. بنابراین در این تحقیق از روش توالییابی دو سویه با طول خوانش 150 نوکلئوتید و مقدار حداقل 5 گیگا باز برای هر نمونه (به عنوان مثال 5 گیگا باز برای خوانشهای سمت راست یکی از نمونهها) استفاده گردید. مشخصات خوانشهای بدست آمده برای هریک از نمونهها در جدول 1 اشاره شده است. جهت تعیین کیفیت خوانشها از نرم افزار FastQC و جهت فیلتر و برش بازهای نامناسب از نرم افزار FASTX-Toolkit استفاده شد. نتایج ارزیابی کیفیت خوانشها نشان داد که کیفیت خوانشها از نظر میانگین کیفیت تک تک نوکلئوتیدها (شکل 1-2) و میانگین کیفیت خوانشها (شکل 2-2) از وضعیت مطلوبی برخوردار میباشند. مونتاژ خوانشها جهت ایجاد ترانسکریپتوم رفرنس با نرم افزار Trinity و تنظیمات پیش فرض روی یک کامپیوتر سرور با سیستم عامل لینوکس انجام گرفت. ترانسکریپتوم حاصل دارای 158436 ترانسکریپت با طول متوسط 53/821 نوکلئوتید میباشد. جهت تعیین کیفیت ترانسکریپتوم مونتاز شده از نرمافزار Transrate استفاده گردید. ارزیابی ترانسکریپتوم با این نرم افزار نشان داد که 1/73 درصد خوانشهای گل و 11/80 درصد از خوانشهای ریشه در تولید ترانسکریپتوم استفاده شده اند. که این نشان از راندمان بالای استفاده از خوانشها میباشد. بطور کلی هر چه این عدد بزرگتر باشد نشان از کیفیت بالاتر مونتاژ است، ضمن اینکه کمتر از 60 درصد بودن این اعداد نشاندهنده راندمان پایین مونتاژ یا کیفیت پایین خوانشها میباشد (Smith-Unna et al., 2016).
.
شکل 1: ارزیابی RNA استخراج شده جهت ساخت کتابخانه cDNA. شکل 1-1: ارزیابی روی ژل 1 درصد آگارز، شکل 1-2: ارزیابی با دستگاه بایوآنالیزر 2100.
Figure 1: Evaluation of extracted RNA for making cDNA library. Fig 1-1: Evaluation applied on 1% agarose gel, Fig 1-2: Evaluation by Bioanalyzer machine 2100.
جدول 1: کمیت و کیفیت خوانش های بدست آمده از توالی یابی با دستگاه Illumina HiSeq2000
Table 1: Short reads quantity and quality from sequencing by Illumina HiSeq2000
Sample |
Read length (bp) |
Number of Reads |
Q20 (%) |
GC (%) |
Root |
150 |
41,403,916 |
97.12:96.98
|
43.87 |
Flower |
150 |
35,028,552 |
97.92:95.97 |
53.55 |
شکل 2: نتایج تعیین کیفیت خوانشها. شکل2-1: میانگین کیفیت نوکلئوتیدها شکل 2-2: میانگین کیفیت خوانشها.
Figure 2: Short reads quality control by FastQC. Fig 2-1: Quality scores across all bases, and Fig 2-2: Quality score distribution over all reads.
شناسایی و تفسیر عملکردی ترانسکریپتوم با دیتابیس های مختلف
جهت شناسایی و مستندسازی ترانسکریپتوم باریجه از همردیفی ترانسکریپتوم با دیتابیسهای پروتئینی رایج از جمله دیتابیس پروتئینهای غیر تکراری NCBI ، Swiss-Prot، TAIR10 و PLAZA 3.0 استفاده گردید. بدین منظور فایل دیتابیسهای مذکور دانلود شده و پس از ساخت دیتابیس با کمک نرم افزار +BLAST همردیفی ترانسکریپتوم با این دیتابیسها با استفاده از BLASTX انجام گرفت(E-value ≤ 10-5) . برای شناسایی و مستند سازی ژنهای درگیر در مسیرهای بیوسنتز متابولیتهای ثانویه از دیتابیسهای KEGG و PlantCyc استفاده گردید. جهت بررسی راندمان و سرعت مستند سازی با زیر دیتابیس گیاهی پروتئینهای غیر تکراری NCBI، این زیر مجموعه ساخته شد و سپس BLASTX مشابه با موارد قبل انجام گرفت. بطور کلی 100275 (29/63 درصد) ترانسکریپت با موفقیت مستند سازی گردید که سهم هر دیتابیس در این پروسه در جدول 2 و شکل 3 آمده است.
جدول 2: نتایج حاصل از BLASTX ترانسکریپتوم با دیتابیسهای مختلف (E-value ≤ 10-5)
Table 2: Results of aligning transcriptome with different databases (BLASTX, E-value ≤ 10-5 )
Databases |
Number of Hits |
NCBI nr-Proteins |
99,144 (62.57 %) |
Swiss-Prot |
66,312 (41.85 %) |
TAIR10 |
82,662 (52.17 %) |
PLAZA 3.0 |
89,137 (56.26 %) |
KEGG |
43,859 (27.68 %) |
PlantCyc |
49,053 (30.96 %) |
زیردیتابیس گیاهی nr |
89,205 (56.30 %) |
Total |
100,275 (63.29 %)) |
شکل3: مقایسه دیتابیس های مختلف استفاده شده برای تفسیرسازی ترانسکریپتوم باریجه. نواحی مشترک نشان دهنده توالیهای تفسیرشده مشترک بین دیتابیسهای مختلف میباشد.
Figure 3: Comparison of databases used to annotate the transcriptome of F. gummosa. The overlapping sections represent the shared transcripts that are annotated by different databases.
همانطور که انتظار میرفت بیشترین تعداد ترانسکریپت دارای هیت از بلاست توالیها با دیتابیس NCBI-nr حاصل گردید. که این نتیجه نشاندهنده کامل تر بودن این دیتابیس نسبت به سایر دیتابیسها میباشد. کامل تر بودن دیتابیس NCBI-nr ناشی از زیاد بودن تعداد توالی و حجم دیتابیس میباشد که همین موضوع منجر به سرعت پایین تفسیرسازی ترانسکریپتوم با این دیتابیس میشود. بنابراین استفاده از این دیتابیس برای تعداد زیادی توالی مثل ترانسکریپتوم باریجه تنها با استفاده از سرور قدرتمند و صرف زمان زیاد مقدور میباشد. به منظور کاهش حجم دیتابیس NCBI-nr از روش ساخت زیردیتابیس گیاهی این دیتابیس استفاده گردید. زیر دیتابیس گیاهی این دیتابیس حجمی حدود 10 درصد دیتابیس اصلی را دارد. مقایسه زیر دیتابیس گیاهی nr با دیتابیس اصلی (در صورت مشابه بودن سیستم مورد استفاده و پارامترهای بلاست) نشان داد که زمان مورد نیاز برای بلاست کل ترانسکریپتوم با زیردیتابیس گیاهی nr، 24 برابر کمتر خواهد بود. از نظر تعداد ترانسکریپت دارای هیت، با استفاده از دیتابیس اصلی NCBI-nr تعداد 9937 ترانسکریپت بیشتر از زیردیتابیس گیاهی آن شناسایی و تفسیر گردید. ارزیابی بیشتر این 9937 ترانسکریپت نشان داد که این توالیها مربوط به آلودگیهای باکتریایی، ویروسی، قارچی، حشرات و سایر موجودات زنده دارای روابط پارازیتی یا همزیستی با باریجه میباشند. بر اساس نتایج حاصل از تفسیر سازی ترانسکریپتوم با دیتابیس NCBI-nr در مجموع 13318 (39/8 درصد) تراسکریپت دارای شباهت با پروتئینهای انگور ، 6410 (04/4 درصد) با قهوه کانفورا و 6389 (02/4 درصد) با کنجد میباشند.
دسته بندی ترانسکریپتوم باریجه از نظر GO و KOG
در تحقیق حاضر جهت طبقه بندی ترانسکریپوم (ترانسکریپتوم بدست آمده از گل و ریشه باریجه) بر اساس وظایف ژنها از دو روش طبقه بندی بر اساس هستی شناسی ژنها (GO)، و طبقه بندی بر اساس وظایف ژنهای ارتولوگ (KOG) استفاده گردید. جهت ارزیابی GO، برای ترانسکریپتهای شناسایی شده با دیتابیس NCBI-nr (دارای هیت) GO های موجود استخراج شده و سپس دسته بندی میشوند. در کل برای 73678 (50/46 درصد) ترانسکریپت ها و 42151 (55/37 درصد) یونیژنهای باریجه حداقل یک GO شناسایی شد. GOهای با فراوانی بالا در 60 گروه و سه دسته اصلی فرایندهای بیولوژیکی ، عملکردهای مولکولی و اجزای سلولی طبقه بندی شدند. در دسته فرایندهای بیولوژیکی بیشترین GO مرتبط با پروتئینهای درگیر در فرایندهای سلولی (25607 ژن، 28/22 درصد)، فرایندهای متابولیکی (27/22 درصد)، فرایندهای بیوسنتزی (54/8 درصد)، تنظیمات بیولوژیکی (87/6 درصد) و پاسخ به تحریکات (73/6 درصد) میباشد. این نتایج نشاندهندهی آن است که گیاه در وضعیت فعال متابولیکی قرار داشته است. از نظر عملکردهای مولکولی بیشترین GO ها مرتبط با عملکردهای اتصالی (27589 ژن، 57/24 درصد)، فعالیتهای کاتالیکی (47/20 درصد)، عملکردهای اتصالی به ممبران اندامکها (99/10 درصد)، اتصال نوکلئوتیدی (72/9 درصد) و اتصال نوکلئوتیدهای پورین (40/8 درصد) میباشند. در دسته اجزای سلولی بیشترین GO ها در دسته سلولی (23599 ژن، 02/21 درصد)، درون سلولی (90/14 درصد)، اندامکی (12/12 درصد)، اندامکهای درون سلولی (11/12 درصد) و ممبران اندامکی (07/11 درصد) میباشند. برای دسته بندی بیشتر ژنها بر اساس عملکرد آنها، از روش مقایسه ژنها با دیتابیس گروههای پروتئینی ارتولوگ استفاده گردید (شکل 4).
شکل 4: طبقه بندی ژن های باریجه بر اساس عملکرد آن ها در مقایسه با پروتئین های کلاستر بندی شده (KOG).
Figure 4: KOG classification of F. gummosa transcriptome.
در مجموع 42452 ترانسکریپت و 24538 ژن در 3925 خانواده عملکردی و 26 کلاس کلی دسته بندی شدند. پروتئینهایی که در یک کلاس قرار میگیرند از یک جد پروتئینی مشترک بوجود آمده اند. بزرگترین کلاس پروتئینی ترانسکریپت باریجه متعلق به دسته مکانیسم های انتقال سیگنالی (29/14 درصد) میباشد. بعد از آن عملکردهای عمومی (65/11 درصد) و تغییرات بعد از ترجمه (40/9 درصد). همچنین 1806 (25/4 درصد) ترانسکریپت و 921 (75/3 درصد) ژن در دسته بیوسنتز متابولیتهای ثانویه، انتقال و کاتابولیسم قرار میگیرند که نشان دهنده آن است که مقدار زیاد و متنوعی متابولیتهای ثانویه در باریجه تولید میشود.
نتیجهگیری کلی
تحقیق حاضر به عنوان اولین مطالعه روی ترانسکریپتوم باریجه منجر به تولید اطلاعات مولکولی بسیار ارزشمندی گردید که این اطلاعات راه را برای سایر مطالعات اصلاحی باز مینماید. نتایج نشان داد که جهت تفسیر عملکردی ترانسکریپتوم تلفیقی از دیتابسهای متفاوت مطلوب میباشد اما برای گیاهان بجای استفاده از دیتابیس nr میتوان از زیر دیتابیس گیاهی nr استفاده کرد که در اینصورت با راندمان مشابه صرفه جویی زیادی در وقت و هزینه خواهد شد. همچنین نتایج دسته بندی ترانسکریپتوم از نظر GO و KOG نشان داد که گل و ریشه باریجه از نظر تولید متابولیتهای ثانویه در وضعیت فعالی قرار دارند.
سپاسگزاری
این پروژه با حمایت مالی مرکز مطالعات و همکاریهای علمی بینالمللی انجام شده است.
REFERENCES
REFERENCES