ارزیابی ترانسکریپتوم گیاه باریجه (Ferula gummosa) با استفاده از روش RNA-seq

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری گروه زراعت و اصلاح نباتات پردیس کشاورزی و منابع طبیعی دانشگاه تهران

2 استاد گروه زراعت و اصلاح نباتات پردیس کشاورزی و منابع طبیعی دانشگاه تهران

3 استاد گروه بیوتکنولوژی پردیس کشاورزی و منابع طبیعی دانشگاه تهران

4 دانشیار گروه زراعت و اصلاح نباتات پردیس کشاورزی و منابع طبیعی دانشگاه تهران

چکیده

گیاه باریجه با نام علمی Ferula gummosa Boiss، از تیره چتریان بومی مناطق شرق و غرب ایران است. گیاه باریجه به دلیل داشتن قابلیت استحصال شیرابه ای با ارزش دارویی و صنعتی، بسیار مورد توجه است. اگر چه این شیرابه از حیث صادرات گیاهان دارویی مرتعی ایران در رتبه اول قرار دارد و خواص دارویی و کاربردهای صنعتی فراوانی دارد اما اطلاعات اندکی در زمینه مکانیسمهای بیوشیمیایی و ژنتیکی تولید این ترکیبات وجود دارد. در حال حاضر تکنیک RNA-Seq جزو پرکاربردترین و دقیقترین روشهای ترانسکریپتومیکس به شمار می رود. در تحقیق حاضر جهت ارزیابی ترانسکریپتوم باریجه از روش RNA-seq برای دو اندام ریشه و گل استفاده گردید. خوانشهای بدست آمده از دستگاه Illumina HiSeq2000 پس از تعیین کیفیت، با نرم افزار Trinity مونتاژ و سپس از نظر عملکرد مورد ارزیابی قرار گرفتند. ترانسکریپتوم حاصله دارای 158436 ترانسکریپت با N50 برابر با 1348 نوکلئوتید بود که پس از بلاست با دیتابیسهای مختلف 100275 ترانسکریپت از نظر عملکردی تفسیر شدند. ارزیابی نتایج بلاست nr از نظر هستی شناسی ژنها منجر به شناسایی 73678 ترانسکریپت دارای حداقل یک GO گردید که از بین آنها از نظر فرایندهای زیستی، فرایندهای سلولی و متابولیکی بیشترین GOها را به خود اختصاص دادند که این حالت نشان دهنده وضعیت فعال متابولیکی گیاه میباشد. ارزیابی ترانسکریپتوم از نظر ژنهای ارتولوگ منجر به شناسایی 42452 ژن از 3925 خانواده عملکردی در 26 کلاس کلی گردید. کلاس متابولیت های ثانویه، انتقال و کاتابولیسم با فراوانی 25/4 درصد از جمله فعالترین کلاسهای عملکردی در گل و ریشه باریجه میباشند.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluation of Ferula gummosa Transcriptome by RNA-Seq

نویسندگان [English]

  • Ahmad Sobhani Najafabadi 1
  • MohammadReza Naghavi 2
  • Hamid Farahmand 3
  • Ali Reza Abbasi 4
1 Agronomy and Plant Breeding Dept., Faculty of Agriculture, University of Tehran, Iran.
2 Agronomy and Plant Breeding Dept., Faculty of Agriculture, University of Tehran, Iran.
3 Biotechnology Dept., Faculty of Agriculture, University of Tehran, Iran.
4 Agronomy and Plant Breeding Dept., Faculty of Agriculture, University of Tehran, Iran.
چکیده [English]

Ferula gummosa Boiss is a herbaceous plant from the Apiaceae family that is indigenous to East and West of Iran. Galbanum is an oleo-gum-resin with high pharmaceutical and industrial values, which is exuded from F. gummosa in response to wounds. Although galbanum ranks first in terms of Iranian export of pasture medicinal plants, little information exists on the genetic and biochemical mechanisms of these compounds are existed. In this regard, transcriptomics studies of medicinal plants have much to contribute to this field of science. RNA-Seq techniques are now one of the most used and most accurate methods in transcriptomics. In the present study, RNA-Seq was used to evaluate the root and flower of F. gummosa transcriptome. Short reads obtained from Illumina HiSeq2000 were assembled by Trinity software after trimming and filtering for quality scores below 30. The assembled transcriptome with 158,436 transcripts and N50 1,348 bp was annotated using different databases such as NCBI nr-proteins, Plant sub-database of NCBI nr-proteins, Swiss-Prot, TAIR10 and PLAZA 3. In total, 100,275 transcripts were annotated using BLASTX with an E-value cut-off of 10-5. Gene ontology (GO) classification of annotated transcripts was done by Blast2Go and Trinotate pipeline and in total 73,678 transcripts with at least one GO were identified. In terms of biological processes, cellular and metabolic processes are the most GO terms (44.55 %) indicated that the plant is in a metabolically active status. Transcriptome assessment of orthologous genes by NCBI-KOG database led to the identification of 42,452 genes from 3,925 families and 26 functional classes. The largest class of orthologous genes was associated with signal transduction mechanisms (14.29 %), followed by other classes, such as secondary metabolites-transport and catabolism with a frequency of 4.25 % (1,806 transcripts) indicating the most active status of F. gummosa roots and flowers for secondary metabolite production and transportation.

کلیدواژه‌ها [English]

  • Biological processes
  • pharmaceutical plants
  • sequencing
  • secondary metabolites

مقدمه

گیاهان دارویی یکی از مهم­ترین منابع امیدوارکننده برای تولید انواع داروها و همچنین درمان انواع بیماری­ها محسوب می شوند. به گونه­ای که تاکنون بسیاری از ترکیبات دارویی مهم و فعال از منابع گیاهی مختلف استخراج و مورد استفاده قرار گرفته است (Julsing et al., 2008) با این وجود، در برخی موارد معرفی منابع اولیه برای تولید چنین ترکیبات دارویی (در مقیاس وسیع و بصورت پایدار) با برخی چالش­ها و مشکلاتی همراه بوده است (Sarfaraj Hussain et al., 2012). ایران به عنوان کشوری غنی از نظر پوشش و تنوع گیاهان دارویی، رویشگاه گیاهانی می­باشد که جنبه های دارویی آن­ها به اثبات رسیده است، ولی مطالعات مولکولی و بیوشیمیایی کمتر روی آن­ها صورت گرفته است.

گیاه باریجه با نام علمی Ferula gummosa Boiss از تیره چتریان، Apiaceae، بومی مناطق شرق و غرب ایران است و در استان­هایی نظیر سمنان، خراسان، اصفهان، فارس و استان­های مرکزی کشور پراکنده شده است
 (Shahbazi et al., 2011). این گیاه علفی، چندساله و مونوکارپیک است که در سال آخر رویش (سال پنجم تا هشتم) به ساقه می­رود و تشکیل گل و میوه می­دهد. هرگونه خراش و یا گزش در ریشه و یا ساقه منجر به خروج شیرابه می­گردد (Ghannadi & Amree, 2002). در طب سنتی این گیاه به منظور تسکین دردها، درمان بیماری­های داخلی و به عنوان ضدعفونی کننده زخم­ها مورد استفاده قرار می­گرفته است. مطالعات مختلف، اثرات دارویی این گیاه را تأیید کرده­اند  (Abbaszadegan et al., 2015; Seyed et al., 2010). در همین راستا مطالعات ترانسکریپتومیکس کمک بسیاری به این زمینه از علم گیاهان دارویی کرده­اند. به طوری که بسیاری از گیاهان دارویی مهم دنیا به منظور شناسایی رابطه بین ترکیبات ارزشمند و ژن­های مرتبط با بیوسنتز آنها تحت مطالعه قرار گرفته­اند (Colebatch et al., 2004; Yang et al., 2009; Zulak et al., 2007). تکنیک RNA-Seq که در حال حاضر جزو پر کاربردترین و دقیق‌ترین روش‌های ترانسکریپتومیکس به شمار می­رود ابزاری است که می­تواند با راندمان بالا روابط ذکر شده بین ژن­های مرتبط با ترکیبات ارزشمند را کشف کند (Spyropoulou et al., 2014; Tang et al., 2011).

طی سال­های اخیر مطالعات بسیار زیادی از روش RNA-seq برای پی بردن به مکانیسم پیچیده مقاومت‌ها و متابولیسم ترکیبات مؤثره گیاهان دارویی استفاده کرده­اند. کراری و همکاران با مطالعه روی پروفایل متابولیتی و پروفایل بیان ژن گوجه فرنگی در مراحل مختلف رشد، موفق به شناسایی رفتارهای ژن­ها طی فرایند رسیدن گوجه فرنگی شدند و از این طریق ژن­های درگیر در مسیر بیوسنتز لیکوپن در گوجه فرنگی را مورد مطالعه قرار دادند (Carrari et al., 2006). شی و همکاران با همین روش ژن­های کاندید مسیرهای بیوسنتز متابولیت­های مهم چای را مورد بررسی قرار دادند (Shi et al., 2011). گوپتا و همکاران با همین روش متابولیسم فلاونویید های بلوبری را مورد مطالعه قرار دادند  (Gupta et al., 2015). وایدیا و همکاران با استفاده از این تکنیک ها ژن­های درگیر در مسیر بیوسنتز دیاسژنین را شناسایی کردند(Vaidya et al., 2013). کیونگ هیون و همکاران با اندازه گیری پروفایل متابولیت های توت سیاه در مراحل مختلف و تلفیق داده ها با پروفایل RNA-Seq آن، موفق به شناسایی ژن­های درگیر در بیوسنتز آنتوسیانین­های توت سیاه شدند (Hyun et al., 2014). چندین پروژه دیگر، ژن­های درگیر در مسیر­های متابولیسمی کارتنوئید­ها، آلکالوئیدها، فلاونوئیدها، ترپنوئیدها و بطور کلی متابولیت­های ثانویه را مورد مطالعه قرار داده­اند.

یا توجه به فقدان داده­های مولکولی روی این گونه و دیگر گونه­های بومی از خانواده چتریان لزوم انجام تحقیقات ژنومیکس و ترانسکریپتومیکس بیش از پیش ضروری بنظر می­رسد (تا  

مواد و روش‌ها

نمونه‌برداری

نمونه های گیاهی تحقیق حاضر در خرداد 1393 از ارتفاعات روستای شهرستانک واقع در جاده چالوس در ارتفاع 2200 متری از سطح دریا، عرض جغرافیایی 35 درجه، 58 دقیقه و 10 ثانیه شمالی و طول جغرافیایی 51 درجه، 21 دقیقه و 13 ثانیه شرقی جمع آوری شدند. از آنجا که ریشه و گل از نظر تولید ترپن­ها (بخش قابل توجه شیرابه باریجه) فعالیت بالایی دارند، این دو اندام جهت مطالعات ترانسکریپتوم مورد استفاده قرار گرفتند. نمونه­های گل و ریشه از یک گیاه سالم به طول تقریبی 120 سانتی متر، در اواخر مرحله گلدهی (قبل از ریزش گلبرگ­های زرد) گرفته شده و با کمک مرکز ملی ذخایر ژنتیک از نظر گیاه شناسی مورد تأیید قرار گرفتند. دو اندام ریشه و گل گیاه بطور جدا گانه با ازت مایع فریز شدند و برای مراحل بعدی کار در دمای 20- درجه سانتیگراد نگهداری شدند.

استخراج و ارزیابی RNA

اولین مرحله در آنالیز ترانسکریپتوم استخراج RNA با کیفیت و کمیت مناسب می­باشد. از آنجا که باریجه گیاهی چند ساله با ریشه های چوبی و چوب پنبه­ای همراه با شیرابه زیاد می­باشد، استخراج RNA با کیفیت از اندام­های مختلف آن بخصوص ریشه بسیار سخت و وقت‌گیر می­باشد. در این تحقیق روش­های مختلف استخراج RNA از جمله استفاده از کیت­های ستونی و کیت­های رسوبی از جمله ترایزول و بایوزول و روش­های دستی مورد ارزیابی قرار گرفتند که از بین این روش­ها روش استفاده از کیت بایوزول (BioFlux) بهترین و موثرترین روش بوده است (Johnson et al., 2012). RNA استخراج شده با دستگاه­های نانودراپ 2000، بایوآنالیزر 2100 و الکتروفورز ژل آگارز مورد ارزیابی قرار گرفت.

ساخت کتابخانه cDNA و توالی­یابی

اولین مرحله در تولید یک کتابخانه cDNA، جداسازی mRNAی کل از یک نوع سلول یا بافت مورد نظر است. از آنجا که   جهت جداسازی آن­ها از rRNA ها و tRNA های موجود در سلول از زنجیره کوتاهی از تیمیدیلات (الیگوdT) متصل به بستر ستون کروماتوگرافی؛ استفاده شد. پس از جداسازی mRNAها و ساخت cDNA دو رشته­ای، در نهایت کتابخانه cDNA توسط دستگاه Illumina HiSeqTM 2000 با استفاده از فناوری Paired-end با طول قرائت 150 نوکلئوتید طبق دستورالعمل کمپانی BGI توالی­یابی شدند.

تعیین کیفیت و مونتاژ خوانش­ها

نتایج حاصل از دستگاه توالی یابی Illumina 2000TM HiSeq خوانش­های خام نامیده می­شوند که در قالب فایل فستکیو ذخیره می­شوند. داده خام حاوی خوانش­های نامطلوبی است که می تواند در آنالیزهای بیوانفورماتیکی بعدی اثر منفی داشته باشند. بنابراین توالی­ها با معیار Q20 (معیاری برای سنجش کیفیت توالی­ها)، سنجیده شده و توالی­های خام با کیفیت مناسب برای مونتاژ استفاده شدند. لازم به ذکر است که فایل­های حاوی خوانش­های ریشه و گل به صورت جدا گانه در قسمت آرشیو خوانش­های توالی­های (SRA) سایت NCBI ثبت شدند ( 

نرم افزار Trinity v2.2.0 روی یک کامپیوتر سرور با رم 256 گیگا بایت و دارای 24 هسته سی پی یو 2 گیگاهرتزی و سیستم عامل لینوکس اوبونتو  برای مونتاژ این خوانش­های خام استفاده گردید (Haas et al., 2013). جهت بررسی ترانسکریپتوم حاصل، تعداد ترانسکریپت و یونی ژن مونتاژ شده، میانگین طول آن­ها و N50 با نرم افزار Trinitystats.pl محاسبه شدند. و ترانسکریپتوم مونتاژ شده جهت تعیین کیفیت مونتاژ، با نرم افزار Transrate مورد ارزیابی قرار گرفت (Li et al., 2014).

تفسیر عملکردی ترانسکریپتوم

ترانسکریپتوم باریجه توسط نرم­فزارهای مختلف از جمله Blast2GO و +BLAST با دیتابیس­هایی چون NCBI-nr proteins، Plaza 3.0، Swiss-Prot، TAIR10، PlantCyc و KEGG همردیفی شدند تا توالی­های مشابه با آن­ها شناسایی شوند . BLASTX با حدآستانه­ی (E-value ≤ 10-5) برای تفسیر عملکردی ترانسکریپتوم با دیتابیس‌های مذکور استفاده گردید. از آنجا که دیتابیس nr دارای حجم بسیار زیادی می­باشد برای بلاست با این دیتابیس از کامپیوتر سرور با 24 هسته سی پی یو استفاده شد. از آنجا که بلاست nr کاری زمان بر است در این تحقیق سعی شد راندمان بلاست با زیر مجموعه گیاهی nr نیز مورد ارزیابی قرار بگیرد. نتایج حاصل از بلاست با دیتابیس­های مختلف توسط نرم­افزار R با هم مقایسه گردید(Correa & Silva, 2011).

ارزیابی GO و KOG ترانسکریپتوم

آنالیز GO کل ترانسکریپتوم با نرم­افزارهای Trinotate، Funrich و Blast2Go  انجام گرفت و بدین ترتیب کلیه یونیژن­های دارای GO شناسایی شده و دسته بندی آن­ها در سه دسته Biological process، Molecular function و Cellular component در نرم­افزارهای R و Exell انجام گرفت (Inglis et al., 2013; Supek et al., 2011). آنالیز KOG  از طریق بلاست (rpsBLAST) ترانسکریپتوم با دیتابیس KOG وبسایت NCBI انجام گرفت. نتایج بلاست با فایل حاوی اطلاعات تکاملی ژن­ها داده کاوی گردید و یونیژن­ها در گروه­های ارتولوگ دسته بندی شدند (Annadurai et al., 2012).

نتایج و بحث

استخراج و ارزیابی کیفی و کمی RNA

همانطور که اشاره گردید در این آزمایش روش­های مختلفی برای استخراج RNA استفاده گردید که به دلیل خاصیت رزینی و فنولی اندام­های باریجه، بخصوص ریشه، اکثر آن­ها با شکست مواجه گردید. در نهایت استخراج با روش بایوزول انجام گرفت و نتایج مطلوب حاصل گردید. در این آزمایش سعی شد RNA بدست آمده کیفیت و کمیت مطلوبی داشته باشد و در نهایت برای توالی یابی و سنتز cDNA از RNA هایی استفاده شد که نسبت 260 به 280 بیشتر از 2، نسبت 260 به 230 بیشتر از 8/1 (NanoDrop-2000)، نسبت RNA ریبوزومی s 28 به s 18 بیشتر از 5/1 (الکتروفورز رو ژل آگارز 1 درصد) و اینتگریتی (RIN) بیشتر از 8 (بایو آنالیزر با دستگاه Agilent Bioanalyzer-2100) باشند. نمونه ای از عکس ژل الکتروفورز و نتایج بایوآنالیزر RNA های استفاده شده برای دو اندام ریشه و گل باریجه در شکل 1آورده شده است.

توالی­یابی، ارزیابی خوانش­ها و مونتاژ ترانسکریپتوم

جهت توالی یابی RNA از روش ساخت کتابخانه cDNA با روش oligo-dT استفاده گردید. جهت توالی یابی ترانسکریپتوم از دستگاه Illumina HiSeq2000 استفاده گردید که از نظر تولید خوانش­های با کمیت و کیفیت بالا بسیار مطلوب می­باشد. از آنجا که برای باریجه ژنوم رفرنسی وجود نداشت و توالی­یابی RNAی آن نیز برای بار اول انجام می­گرفت، استفاده از پایپ لاین مونتاژ از نو جهت بازسازی ترانسکریپتوم و آنالیزهای بعدی اجتناب ناپذیر بود. که در این موارد هر چه طول و تعداد خوانش­ها بیشتر باشند بهتر است. بنابراین در این تحقیق از روش توالی­یابی دو سویه با طول خوانش 150 نوکلئوتید و مقدار حداقل 5 گیگا باز برای هر نمونه (به عنوان مثال 5 گیگا باز برای خوانش­های سمت راست یکی از نمونه­ها) استفاده گردید. مشخصات خوانش­های بدست آمده برای هریک از نمونه­ها در جدول 1 اشاره شده است. جهت تعیین کیفیت خوانش­ها از نرم افزار FastQC و جهت فیلتر و برش بازهای نامناسب از نرم افزار FASTX-Toolkit استفاده شد. نتایج ارزیابی کیفیت خوانش­ها نشان داد که کیفیت خوانش­ها از نظر میانگین کیفیت تک تک نوکلئوتیدها (شکل 1-2) و میانگین کیفیت خوانش­ها (شکل 2-2)  از وضعیت مطلوبی برخوردار می­باشند. مونتاژ خوانش­ها جهت ایجاد ترانسکریپتوم رفرنس با نرم افزار Trinity  و تنظیمات پیش فرض روی یک کامپیوتر سرور با سیستم عامل لینوکس انجام گرفت. ترانسکریپتوم حاصل دارای 158436 ترانسکریپت با طول متوسط 53/821 نوکلئوتید می­باشد. جهت تعیین کیفیت ترانسکریپتوم مونتاز شده از نرم­افزار Transrate استفاده گردید. ارزیابی ترانسکریپتوم با این نرم افزار نشان داد که 1/73 درصد خوانش­های گل و 11/80 درصد از خوانش­های ریشه در تولید ترانسکریپتوم استفاده شده اند. که این نشان از راندمان بالای استفاده از خوانش­ها می­باشد. بطور کلی هر چه این عدد بزرگتر باشد نشان از کیفیت بالاتر مونتاژ است، ضمن اینکه کمتر از 60 درصد بودن این اعداد نشان­دهنده راندمان پایین مونتاژ یا کیفیت پایین خوانش­ها می­باشد (Smith-Unna et al., 2016).

 

.

 
   


شکل 1: ارزیابی RNA استخراج شده جهت ساخت کتابخانه cDNA. شکل 1-1: ارزیابی روی ژل 1 درصد آگارز، شکل 1-2: ارزیابی با دستگاه بایوآنالیزر 2100.

Figure 1: Evaluation of extracted RNA for making cDNA library. Fig 1-1: Evaluation applied on 1% agarose gel, Fig 1-2: Evaluation by Bioanalyzer machine 2100.

 

 

جدول 1: کمیت و کیفیت خوانش های بدست آمده از توالی یابی با دستگاه Illumina HiSeq2000

Table 1: Short reads quantity and quality from sequencing by Illumina HiSeq2000

Sample

Read length (bp)

Number of Reads

Q20 (%)

GC (%)

Root

150

41,403,916

97.12:96.98

 

43.87

Flower

150

35,028,552

97.92:95.97

53.55

شکل 2: نتایج تعیین کیفیت خوانش‌ها. شکل2-1: میانگین کیفیت نوکلئوتیدها  شکل 2-2: میانگین کیفیت خوانش­ها.

Figure 2: Short reads quality control by FastQC. Fig 2-1: Quality scores across all bases, and Fig 2-2: Quality score distribution over all reads.

 

 

شناسایی و تفسیر عملکردی ترانسکریپتوم با دیتابیس های مختلف

جهت شناسایی و مستندسازی ترانسکریپتوم باریجه از همردیفی ترانسکریپتوم با دیتابیس­های پروتئینی رایج از جمله دیتابیس پروتئین­های غیر تکراری NCBI ، Swiss-Prot، TAIR10 و PLAZA 3.0 استفاده گردید. بدین منظور فایل دیتابیس­های مذکور دانلود شده و پس از ساخت دیتابیس با کمک نرم افزار +BLAST همردیفی ترانسکریپتوم با این دیتابیس­ها با استفاده از BLASTX انجام گرفت(E-value ≤ 10-5) . برای شناسایی و مستند سازی ژن­های درگیر در مسیرهای بیوسنتز متابولیت­های ثانویه از دیتابیس­های KEGG و PlantCyc استفاده گردید. جهت بررسی راندمان و سرعت مستند سازی با زیر دیتابیس گیاهی پروتئین­های غیر تکراری NCBI، این زیر مجموعه ساخته شد و سپس BLASTX مشابه با موارد قبل انجام گرفت. بطور کلی 100275 (29/63 درصد) ترانسکریپت با موفقیت مستند سازی گردید که سهم هر دیتابیس در این پروسه در جدول 2 و شکل 3 آمده است.



جدول 2: نتایج حاصل از BLASTX ترانسکریپتوم با دیتابیس‌های مختلف (E-value ≤ 10-5)

Table 2: Results of aligning transcriptome with different databases (BLASTX, E-value ≤ 10-5 )

Databases

Number of Hits

NCBI nr-Proteins

99,144 (62.57 %)

Swiss-Prot

66,312 (41.85 %)

TAIR10

82,662 (52.17 %)

PLAZA 3.0

89,137 (56.26 %)

KEGG

43,859 (27.68 %)

PlantCyc

49,053 (30.96 %)

زیردیتابیس گیاهی nr

89,205 (56.30 %)

Total

100,275 (63.29 %))

 

 

 

 

 

 

 

 

 

 

 

 
   

 

شکل3: مقایسه دیتابیس های مختلف استفاده شده برای تفسیرسازی ترانسکریپتوم باریجه. نواحی  مشترک نشان دهنده توالی‌های تفسیرشده مشترک بین دیتابیس­های مختلف می­باشد.

Figure 3: Comparison of databases used to annotate the transcriptome of F. gummosa. The overlapping sections represent the shared transcripts that are annotated by different databases.

 

 

همانطور که انتظار می­رفت بیشترین تعداد ترانسکریپت دارای هیت از بلاست توالی­ها با دیتابیس NCBI-nr حاصل گردید. که این نتیجه نشان­دهنده کامل تر بودن این دیتابیس نسبت به سایر دیتابیس­ها می­باشد. کامل تر بودن دیتابیس NCBI-nr ناشی از زیاد بودن تعداد توالی و حجم دیتابیس می­باشد که همین موضوع منجر به سرعت پایین تفسیرسازی ترانسکریپتوم با این دیتابیس می­شود. بنابراین استفاده از این دیتابیس برای تعداد زیادی توالی مثل ترانسکریپتوم باریجه تنها با استفاده از سرور قدرتمند و صرف زمان زیاد مقدور می­باشد. به منظور کاهش حجم دیتابیس NCBI-nr از روش ساخت زیردیتابیس گیاهی این دیتابیس استفاده گردید. زیر دیتابیس گیاهی این دیتابیس حجمی حدود 10 درصد دیتابیس اصلی را دارد. مقایسه زیر دیتابیس گیاهی nr با دیتابیس اصلی (در صورت مشابه بودن سیستم مورد استفاده و پارامترهای بلاست) نشان داد که زمان مورد نیاز برای بلاست کل ترانسکریپتوم با زیردیتابیس گیاهی nr، 24 برابر کمتر خواهد بود. از نظر تعداد ترانسکریپت دارای هیت، با استفاده از دیتابیس اصلی NCBI-nr تعداد 9937 ترانسکریپت بیشتر از زیردیتابیس گیاهی آن شناسایی و تفسیر گردید. ارزیابی بیشتر این 9937 ترانسکریپت نشان داد که این توالی­ها مربوط به آلودگی‌های باکتریایی، ویروسی، قارچی، حشرات و سایر موجودات زنده دارای روابط پارازیتی یا همزیستی با باریجه می­باشند. بر اساس نتایج حاصل از تفسیر سازی ترانسکریپتوم با دیتابیس NCBI-nr در مجموع 13318 (39/8 درصد) تراسکریپت دارای شباهت با پروتئین­های انگور ، 6410 (04/4 درصد) با قهوه کانفورا  و 6389 (02/4 درصد) با کنجد  می­باشند.

 

دسته بندی ترانسکریپتوم باریجه از نظر GO و KOG

در تحقیق حاضر جهت طبقه بندی ترانسکریپوم (ترانسکریپتوم بدست آمده از گل و ریشه باریجه) بر اساس وظایف ژن­ها از دو روش طبقه بندی بر اساس هستی شناسی ژن­ها (GO)، و طبقه بندی بر اساس وظایف ژن­های ارتولوگ (KOG) استفاده گردید. جهت ارزیابی GO، برای ترانسکریپت­های شناسایی شده با دیتابیس NCBI-nr (دارای هیت) GO های موجود استخراج شده و سپس دسته بندی می­شوند. در کل برای 73678 (50/46 درصد) ترانسکریپت ها و 42151 (55/37 درصد) یونیژن­های باریجه حداقل یک GO شناسایی شد. GOهای با فراوانی بالا در 60 گروه و سه دسته اصلی فرایندهای بیولوژیکی ، عملکردهای مولکولی و اجزای سلولی طبقه بندی شدند. در دسته فرایند­های بیولوژیکی بیشترین GO مرتبط با پروتئین‌های درگیر در فرایند­های سلولی (25607 ژن، 28/22 درصد)، فرایندهای متابولیکی (27/22 درصد)، فرایندهای بیوسنتزی  (54/8 درصد)، تنظیمات بیولوژیکی (87/6 درصد) و پاسخ به تحریکات (73/6 درصد) می­باشد. این نتایج نشان­دهنده­ی آن است که گیاه در وضعیت فعال متابولیکی قرار داشته است. از نظر عملکردهای مولکولی بیشترین GO ها مرتبط با عملکردهای اتصالی (27589 ژن، 57/24 درصد)، فعالیت­های کاتالیکی (47/20 درصد)، عملکردهای اتصالی به ممبران اندامک­ها (99/10 درصد)، اتصال نوکلئوتیدی (72/9 درصد) و اتصال نوکلئوتیدهای پورین (40/8 درصد) می­باشند. در دسته اجزای سلولی بیشترین GO ها در دسته سلولی (23599 ژن، 02/21 درصد)، درون سلولی  (90/14 درصد)، اندامکی (12/12 درصد)، اندامک­های درون سلولی (11/12 درصد) و ممبران اندامکی (07/11 درصد) می­باشند. برای دسته بندی بیشتر ژن­ها بر اساس عملکرد آن­ها، از روش مقایسه ژن­ها با دیتابیس گروه­های پروتئینی ارتولوگ استفاده گردید (شکل 4).

 

 

 

 
   


شکل 4: طبقه بندی ژن  های باریجه بر اساس عملکرد آن ها در مقایسه با پروتئین های کلاستر بندی شده (KOG).

Figure 4: KOG classification of F. gummosa transcriptome.

 

در مجموع 42452 ترانسکریپت و 24538 ژن در 3925 خانواده عملکردی و 26 کلاس کلی دسته بندی شدند. پروتئین‌هایی که در یک کلاس قرار می­گیرند از یک جد پروتئینی مشترک بوجود آمده اند. بزرگترین کلاس پروتئینی ترانسکریپت باریجه متعلق به دسته مکانیسم های انتقال سیگنالی (29/14 درصد) می­باشد. بعد از آن عملکردهای عمومی (65/11 درصد) و تغییرات بعد از ترجمه  (40/9 درصد). همچنین 1806 (25/4 درصد) ترانسکریپت و 921 (75/3 درصد) ژن در دسته بیوسنتز متابولیت­های ثانویه، انتقال و کاتابولیسم  قرار می­گیرند که نشان دهنده آن است که مقدار زیاد و متنوعی متابولیت­های ثانویه در باریجه تولید می­شود.

نتیجه‌گیری کلی

تحقیق حاضر به عنوان اولین مطالعه روی ترانسکریپتوم باریجه منجر به تولید اطلاعات مولکولی بسیار ارزشمندی گردید که این اطلاعات راه را برای سایر مطالعات اصلاحی باز می­نماید. نتایج نشان داد که جهت تفسیر عملکردی ترانسکریپتوم تلفیقی از دیتابس­های متفاوت مطلوب می­باشد اما برای گیاهان بجای استفاده از دیتابیس nr می­توان از زیر دیتابیس گیاهی nr استفاده کرد که در اینصورت با راندمان مشابه صرفه جویی زیادی در وقت و هزینه خواهد شد. همچنین نتایج دسته بندی ترانسکریپتوم از نظر GO و KOG نشان داد که گل و ریشه باریجه از نظر تولید متابولیت­های ثانویه در وضعیت فعالی قرار دارند.

 

سپاسگزاری

این پروژه با حمایت مالی مرکز مطالعات و همکاری‌های علمی بین­المللی انجام شده است.

 

 

REFERENCES

  1. Abbaszadegan, A., Gholami, A., Mirhadi, H., Saliminasab, M., Kazemi, A., & Moein, M. R. (2015). Antimicrobial and cytotoxic activity of Ferula gummosa plant essential oil compared to NaOCl and CHX: a preliminary in vitro study. Restor Dent Endod, 40, 50-57.
  2. Annadurai, R. S., Jayakumar, V., Mugasimangalam, R. C., Katta, M. A. V. S. K., Anand, S., Gopinathan, S., Rao, S. N. (2012). Next generation sequencing and de novo transcriptome analysis of Costus pictus D. Don, a non-model plant with potent anti-diabetic properties. BMC Genomics, 13, 663.
  3. Carrari, F., Baxter, C., Usadel, B., Urbanczyk-Wochniak, E., Zanor, M.-I., Nunes-Nesi, A., Fernie, A. R. (2006). Integrated analysis of metabolite and transcript levels reveals the metabolic shifts that underlie tomato fruit development and highlight regulatory aspects of metabolic network behavior. Plant Physiology, 142, 1380-1396.
  4. Colebatch, G., Desbrosses, G., Ott, T., Krusell, L., Montanari, O., Kloska, S., Udvardi, M. K. (2004). Global changes in transcription orchestrate metabolic differentiation during symbiotic nitrogen fixation in Lotus japonicus. Plant Journal, 39, 487-512.
  5. Correa, J., & Silva, G. (2011). Parallel BLAST Analysis and Performance Evaluation. BICoB.
  6. Ghannadi, A., & Amree, S. (2002). Volatile oil constituents of Ferula gummosa boiss. from Kashan, Iran. Journal of Essential Oil Research, 14, 5-7.
  7. Gupta, V., Estrada, A. D., Blakley, I., Reid, R., Patel, K., Meyer, M. D., Loraine, A. E. (2015). RNA-Seq analysis and annotation of a draft blueberry genome assembly identifies candidate genes involved in fruit ripening, biosynthesis of bioactive compounds, and stage-specific alternative splicing. GigaScience, 4, 5.
  8. Haas, B. J., Papanicolaou, A., Yassour, M., Grabherr, M., Blood, P. D., Bowden, J., Regev, A. (2013). De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols, 8, 1494-1512.
  9. Hyun, T. K., Lee, S., Rim, Y., Kumar, R., Han, X., Lee, S. Y., Kim, J. Y. (2014). De-novo RNA sequencing and metabolite profiling to identify genes involved in anthocyanin biosynthesis in Korean black raspberry (Rubus coreanus Miquel). PLoS ONE, 9, 1-13.
  10. Inglis, D. O., Binkley, J., Skrzypek, M. S., Arnaud, M. B., Cerqueira, G. C., Shah, P., Sherlock, G. (2013). Comprehensive annotation of secondary metabolite biosynthetic genes and gene clusters of Aspergillus nidulans, A. fumigatus, A. niger and A. oryzae. BMC Microbiol, 13, 91.
  11. Jalali, H. T., Ebrahimian, Z. J., Evtuguin, D. V., & Neto, C. P. (2011). Chemical composition of oleo-gum-resin from Ferula gummosa. Industrial Crops and Products, 33, 549-553.
  12. Johnson, M. T. J., Carpenter, E. J., Tian, Z., Bruskiewich, R., Burris, J. N., Carrigan, C. T., . . . Wong, G. K. S. (2012). Evaluating methods for isolating total rna and predicting the success of sequencing phylogenetically diverse plant transcriptomes. PLoS ONE, 7.
  13. Julsing, M. K., Quax, W. J., & Kayser, O. (2008). The Engineering of Medicinal Plants: Prospects and Limitations of Medicinal Plant Biotechnology. Medicinal Plant Biotechnology: From Basic Research to Industrial Applications, 1-8.
  14. Li, S., Tighe, S. W., Nicolet, C. M., Grove, D., Levy, S., Farmerie, W., Mason, C. E. (2014). Multi-platform assessment of transcriptome profiling using RNA-seq in the ABRF next-generation sequencing study. Nature Biotechnology, 32, 915-925.
  15. Sarfaraj Hussain, M., Fareed, S., Ansari, S., Akhlaquer Rahman, M., Zareen Ahmad, I., & Saeed, M. (2012). Current approaches toward production of secondary plant metabolites. J Pharm Bioallied Sci., 4, 10-20.
  16. Seyed, B., Nabavi, F., Ebrahimzadeh, A., & Nabavi, M. (2010). Antioxidant activity of flower , stem and leaf extracts of Ferula gummosa Grasasyaceites, 61, 244-250.
  17. Shahbazi, A., Lotfi, M., Mostafavi, K., Asadian, G., & Heidarian, A. R. (2011). Effect of Persian galbanum (Ferula gummosa) extract on seed germination and growth of some weeds. African Journal of Agricultural Research, 6, 5106-5111.
  18. Shi, C.-Y., Yang, H., Wei, C.-L., Yu, O., Zhang, Z.-Z., Jiang, C.-J., Wan, X.-C. (2011). Deep sequencing of the Camellia sinensis transcriptome revealed candidate genes for major metabolic pathways of tea-specific compounds. BMC Genomics, 12, 131.
  19. Smith-Unna, R., Boursnell, C., Patro, R., Hibberd, J., & Kelly, S. (2016). TransRate: reference free quality assessment of de novo transcriptome assemblies. Genome Research, gr. 196469.196115.
  20. Spyropoulou, E. a., Haring, M. a., & Schuurink, R. C. (2014). RNA sequencing on Solanum lycopersicum trichomes identifies transcription factors that activate terpene synthase promoters. BMC Genomics, 15, 402.
  21. Supek, F., Bošnjak, M., Škunca, N., & Šmuc, T. (2011). Revigo summarizes and visualizes long lists of gene ontology terms. PLoS ONE, 6.
  22. Tang, Q., Ma, X., Mo, C., Wilson, I. W., Song, C., Zhao, H., Qiu, D. (2011). An efficient approach to finding Siraitia grosvenorii triterpene biosynthetic genes by RNA-seq and digital gene expression analysis. BMC Genomics, 12, 343.
  23. Vaidya, K., Ghosh, A., Kumar, V., Chaudhary, S., Srivastava, N., Katudia, K., Chikara, S. K. (2013). De Novo Transcriptome Sequencing in L. to Identify Genes Involved in the Biosynthesis of Diosgenin. The Plant Genome, 6(2).
  24. Yang, S., Tschaplinski, T. J., Engle, N. L., Carroll, S. L., Martin, S. L., Davison, B. H., Brown, S. D. (2009). Transcriptomic and metabolomic profiling of Zymomonas mobilis during aerobic and anaerobic fermentations. BMC Genomics, 10, 34.
  25. Zulak, K. G., Cornish, A., Daskalchuk, T. E., Deyholos, M. K., Goodenowe, D. B., Gordon, P. M. K., Facchini, P. J. (2007). Gene transcript and metabolite profiling of elicitor-induced opium poppy cell cultures reveals the coordinate regulation of primary and secondary metabolism. Planta, 225, 1085-1106.

 

 

 

 

  1. REFERENCES

    1. Abbaszadegan, A., Gholami, A., Mirhadi, H., Saliminasab, M., Kazemi, A., & Moein, M. R. (2015). Antimicrobial and cytotoxic activity of Ferula gummosa plant essential oil compared to NaOCl and CHX: a preliminary in vitro study. Restor Dent Endod, 40, 50-57.
    2. Annadurai, R. S., Jayakumar, V., Mugasimangalam, R. C., Katta, M. A. V. S. K., Anand, S., Gopinathan, S., Rao, S. N. (2012). Next generation sequencing and de novo transcriptome analysis of Costus pictus D. Don, a non-model plant with potent anti-diabetic properties. BMC Genomics, 13, 663.
    3. Carrari, F., Baxter, C., Usadel, B., Urbanczyk-Wochniak, E., Zanor, M.-I., Nunes-Nesi, A., Fernie, A. R. (2006). Integrated analysis of metabolite and transcript levels reveals the metabolic shifts that underlie tomato fruit development and highlight regulatory aspects of metabolic network behavior. Plant Physiology, 142, 1380-1396.
    4. Colebatch, G., Desbrosses, G., Ott, T., Krusell, L., Montanari, O., Kloska, S., Udvardi, M. K. (2004). Global changes in transcription orchestrate metabolic differentiation during symbiotic nitrogen fixation in Lotus japonicus. Plant Journal, 39, 487-512.
    5. Correa, J., & Silva, G. (2011). Parallel BLAST Analysis and Performance Evaluation. BICoB.
    6. Ghannadi, A., & Amree, S. (2002). Volatile oil constituents of Ferula gummosa boiss. from Kashan, Iran. Journal of Essential Oil Research, 14, 5-7.
    7. Gupta, V., Estrada, A. D., Blakley, I., Reid, R., Patel, K., Meyer, M. D., Loraine, A. E. (2015). RNA-Seq analysis and annotation of a draft blueberry genome assembly identifies candidate genes involved in fruit ripening, biosynthesis of bioactive compounds, and stage-specific alternative splicing. GigaScience, 4, 5.
    8. Haas, B. J., Papanicolaou, A., Yassour, M., Grabherr, M., Blood, P. D., Bowden, J., Regev, A. (2013). De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols, 8, 1494-1512.
    9. Hyun, T. K., Lee, S., Rim, Y., Kumar, R., Han, X., Lee, S. Y., Kim, J. Y. (2014). De-novo RNA sequencing and metabolite profiling to identify genes involved in anthocyanin biosynthesis in Korean black raspberry (Rubus coreanus Miquel). PLoS ONE, 9, 1-13.
    10. Inglis, D. O., Binkley, J., Skrzypek, M. S., Arnaud, M. B., Cerqueira, G. C., Shah, P., Sherlock, G. (2013). Comprehensive annotation of secondary metabolite biosynthetic genes and gene clusters of Aspergillus nidulans, A. fumigatus, A. niger and A. oryzae. BMC Microbiol, 13, 91.
    11. Jalali, H. T., Ebrahimian, Z. J., Evtuguin, D. V., & Neto, C. P. (2011). Chemical composition of oleo-gum-resin from Ferula gummosa. Industrial Crops and Products, 33, 549-553.
    12. Johnson, M. T. J., Carpenter, E. J., Tian, Z., Bruskiewich, R., Burris, J. N., Carrigan, C. T., . . . Wong, G. K. S. (2012). Evaluating methods for isolating total rna and predicting the success of sequencing phylogenetically diverse plant transcriptomes. PLoS ONE, 7.
    13. Julsing, M. K., Quax, W. J., & Kayser, O. (2008). The Engineering of Medicinal Plants: Prospects and Limitations of Medicinal Plant Biotechnology. Medicinal Plant Biotechnology: From Basic Research to Industrial Applications, 1-8.
    14. Li, S., Tighe, S. W., Nicolet, C. M., Grove, D., Levy, S., Farmerie, W., Mason, C. E. (2014). Multi-platform assessment of transcriptome profiling using RNA-seq in the ABRF next-generation sequencing study. Nature Biotechnology, 32, 915-925.
    15. Sarfaraj Hussain, M., Fareed, S., Ansari, S., Akhlaquer Rahman, M., Zareen Ahmad, I., & Saeed, M. (2012). Current approaches toward production of secondary plant metabolites. J Pharm Bioallied Sci., 4, 10-20.
    16. Seyed, B., Nabavi, F., Ebrahimzadeh, A., & Nabavi, M. (2010). Antioxidant activity of flower , stem and leaf extracts of Ferula gummosa Grasasyaceites, 61, 244-250.
    17. Shahbazi, A., Lotfi, M., Mostafavi, K., Asadian, G., & Heidarian, A. R. (2011). Effect of Persian galbanum (Ferula gummosa) extract on seed germination and growth of some weeds. African Journal of Agricultural Research, 6, 5106-5111.
    18. Shi, C.-Y., Yang, H., Wei, C.-L., Yu, O., Zhang, Z.-Z., Jiang, C.-J., Wan, X.-C. (2011). Deep sequencing of the Camellia sinensis transcriptome revealed candidate genes for major metabolic pathways of tea-specific compounds. BMC Genomics, 12, 131.
    19. Smith-Unna, R., Boursnell, C., Patro, R., Hibberd, J., & Kelly, S. (2016). TransRate: reference free quality assessment of de novo transcriptome assemblies. Genome Research, gr. 196469.196115.
    20. Spyropoulou, E. a., Haring, M. a., & Schuurink, R. C. (2014). RNA sequencing on Solanum lycopersicum trichomes identifies transcription factors that activate terpene synthase promoters. BMC Genomics, 15, 402.
    21. Supek, F., Bošnjak, M., Škunca, N., & Šmuc, T. (2011). Revigo summarizes and visualizes long lists of gene ontology terms. PLoS ONE, 6.
    22. Tang, Q., Ma, X., Mo, C., Wilson, I. W., Song, C., Zhao, H., Qiu, D. (2011). An efficient approach to finding Siraitia grosvenorii triterpene biosynthetic genes by RNA-seq and digital gene expression analysis. BMC Genomics, 12, 343.
    23. Vaidya, K., Ghosh, A., Kumar, V., Chaudhary, S., Srivastava, N., Katudia, K., Chikara, S. K. (2013). De Novo Transcriptome Sequencing in L. to Identify Genes Involved in the Biosynthesis of Diosgenin. The Plant Genome, 6(2).
    24. Yang, S., Tschaplinski, T. J., Engle, N. L., Carroll, S. L., Martin, S. L., Davison, B. H., Brown, S. D. (2009). Transcriptomic and metabolomic profiling of Zymomonas mobilis during aerobic and anaerobic fermentations. BMC Genomics, 10, 34.
    25. Zulak, K. G., Cornish, A., Daskalchuk, T. E., Deyholos, M. K., Goodenowe, D. B., Gordon, P. M. K., Facchini, P. J. (2007). Gene transcript and metabolite profiling of elicitor-induced opium poppy cell cultures reveals the coordinate regulation of primary and secondary metabolism. Planta, 225, 1085-1106.