نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانش آموخته گروه زراعت و اصلاح نباتات، پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران
2 دانشیارگروه زراعت و اصلاح نباتات، پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران
3 استادیار گروه بیوتکنولوژی، دانشکده کشاورزی، دانشگاه تربیت مدرس، تهران، ایران
چکیده
کلیدواژهها
عنوان مقاله [English]
نویسندگان [English]
Tocopherols (Vitamin E) are an important group of organic compounds that realize vital activities in plant cells. They protect the photosynthetic system from photooxidation damages and prevent the lipid peroxidation of the chloroplast membrane. The presence of this plant organic compound in human nutrition is essential. In this research, six genes involved in the biosynthesis pathway of vitamin E including HPPD/ PDS1, VTE5, HPT/ VTE2, VTE3/ APG1/ IE35, TC/ VTE1, γ-TMT/ VTE4 and their products are identified in lentil plant using databases and bioinformatics software. After this identification, genes are implemented for breeding purposes of lentil through traditional breeding or modern biotechnology methods. According to the phylogenetic tree obtained by the MEGA 7 program, it was observed that most of these genes in the lentil have high homology to legume plants such as chickpea and alfalfa. In addition, the prediction of the presence of conserved domains revealed that the HPPD protein had two domains and one subdomain, and each of the proteins γ-TMT and VTE3 had only one conserved domain. Moreover, the results of the proteins description using ProtParam tool showed that the highest frequency with respect to the amino acids belonged to leucine, serine and glycine; by contrast, selenocysteine and pyrrolysine had the lowest frequency. The use of the DeepLoc-1.0 program predicted that only HPPD proteins were soluble in the cytoplasm, while five other proteins were located in the intermembrane space.
کلیدواژهها [English]
مقدمه
عدس (Lens culinaris) گیاهی از خانواده Fabaceae که بعد از سویا در میان حبوبات، بیشترین پروتئین (حدود 25 درصد) و کمترین روغن را دارد و به علت وجود پروتئین بالا، مواد معدنی، فیبر و کربوهیدارتها، منبع غذایی مهمی برای انسان است. ساقه، کاه و کلش و پوسته غلاف این گیاه دارای ارزش غذایی بالایی است و برای مصرف دامهای اهلی مناسب است (Muehlbauer et al., 2006; Yadav et al., 2007; Srivastava & Vasishtha, 2012).
توکوفرولها (ویتامین E)، گروهی از ترکیبات آلی هستند که بهصورت مولکولهای محلول در چربی، در ناحیه چربیدوست غشای سلولی قرار میگیرند. فعالیت بیولوژیکی هر یک از مشتقات ویتامینE، معیار توانایی یا استفاده کارکردی آن است (Mène-Saffrané & DellaPenna, 2010). ویتامین E تنها در موجودات فتوسنتز کننده و برخی از سیانوباکتری ها تولید میشود؛ بنابراین منبع تامین آن در انسان، مصرف گیاهان است (Arango & Heise, 1998). توکوفرول در حفاظت دستگاه فتوسنتزی در برابر خسارت اکسیداتیو و حفاظت اسیدهای چرب غیراشباع از پروکسیداسیون لیپید در غشاهای کلروپلاست نقش دارد (Hugly & Somerville, 1992). ویتامین E عملکردهای حیاتی متعددی شامل دفع فیزیکی اکسیژن منفرد، پاکسازی شیمیایی گونههای فعال اکسیژن متعدد و رادیکالهای آزاد را در انسان انجام میدهد؛ همچنین یک آنتیاکسیدان قطع کننده زنجیره برای حفاظت اسیدهای چرب غیراشباع از پراکسیداسیون لیپید است (Fryer, 1993; Bramley et al., 2000).
واحد ساختاری اصلی ویتامین E شامل یک حلقه کرومانول قطبی (۲-متیل-۶-هیدروکسی کرومانول) مشتق شده از مسیر شیکیمات و یک زنجیره جانبی هیدروفوبیک ۱۶ کربنه از گروه پرنیل است که از مسیر غیر موالونات مستقر در پلاستید مشتق میشود (Spitzer & Schweigert, 2007). بر پایه تعداد و موقعیت گروه متیل موجود در گروه سر کرومانول، چهار فرم متفاوت از توکوفرولها (α-tocopherols، β، γ و δ) در گیاهان یافت شدهاند (Mène-Saffrané & DellaPenna, 2010).
HGA پیشماده همه انواع ویتامین E است و توسط p-هیدروکسی فنیل پیرووات دیاکسیژناز (HPPD[1])، از مسیر شیکیمات تولید میشود (Mene-Saffrane & Pellaud, 2017). زنجیره جانبی پرنیل، توسط گرانیلگرانیل دیفسفات (GGPP[2]) تحت کاتالیزور گرانیلگرانیل پیروفسفات سنتاز (GGPPS[3]) از مسیر متیل اریتریتول فسفات (MEP[4]) تولید میشود (Ruiz‐Sola et al., 2016; Mene-Saffrane and Pellaud, 2017). برای سنتز توکوفرول، نیاز به کاهش GGPP به فایتیل پیروفسفات (PPP[5]) توسط یک گرانیلگرانیل ردوکتاز (GGR[6]) است. در دانهها و برگهای آرابیدوپسیس، سنتز توکوفرول بیشتر به فیتول کیناز VTE5[7] و فایتیل فسفات کیناز VTE6[8] بستگی دارد که بهطور پیوسته فیتول را به فایتیل پیروفسفات فسفوریله میکند (Valentin et al., 2006; Vom Dorp et al., 2015). در برگهای سالم، فیتول مورد استفاده برای سنتز توکوفرول اغلب از هیدرولیز کلروفیل تشکیل شدهاست (Vom Dorp et al., 2015).
گام مهم در بیوسنتز توکوکرومانول، تغلیظ HGA با یک زنجیره جانبی ایزوپرنوئیدی است که بهوسیله پرنیل ترانسفراز انجام میگیرد. سنتز توکوفرول توسط یک هموجنتیسات فایتیل ترانسفراز (HPT[9]) آغاز میشود (Mene-Saffrane and Pellaud, 2017)؛ متیل فایتیل بنزوکوئینون حاصل بهوسیله متیل ترانسفراز (MT[10]) متیله میشود تا دی متیل فایتیل بنزوکوئینون را تشکیل دهد که هر دو فرم بهوسیله توکوفرول سایکلاز (TC[11]) بهترتیب به دلتا توکوفرول و گاما توکوفرول تبدیل میشوند (شکل 1). این ایزوفرمها توسط گاما توکوفرول متیل ترانسفراز (γ-TMT[12]) متیله میشوند و بهترتیب به بتا توکوفرول و آلفا توکوفرول تبدیل میشوند (Mene-Saffrane & Pellaud, 2017).
با توجه به تاثیر توکوفرول در گیاه و انسان، بررسی و مطالعه ژنهای مرتبط با بیوسنتز توکوفرول اهمیت خاصی پیدا میکند. درحال حاضر در پایگاه NCBI، هیچ توالی نوکلئوتیدی از شش ژن مذکور در این مسیر برای گیاه عدس به ثبت نرسیده است که میتوان پس از شناسایی و جداسازی ژنها، آنها را برای اهداف اصلاحی عدس از طریق بهنژادی سنتی یا روشهای نوین زیست فناوری بهکار برد.
مواد و روشها
سرهمبندی خوانشها و شناسایی بیوانفورماتیکی ژنها
در این پژوهش، برای شناسایی شش ژنHPPD/PDS1 ، VTE5،HPT/VTE2 ، VTE3/APG1/IE35، TC/VTE1، ᵧ-TMT/VTE4 به جستجو در کتابخانه Reads[13] گیاه عدس موجود در پایگاه اطلاعاتی NCBI[14] SRA[15] پرداخته شد (https://www.ncbi.nlm.nih.gov/sra/). با استفاده از برنامه Codon Code Aligner v.5.0.1 سرهمبندی خوانشها[16] صورت گرفت و نهایتاً ترجمه توالی توافقی خروجی این نرمافزار با استفاده از برنامه آنلاین ORF finder (https://www.ncbi.nlm.nih.gov/orffinder/) انجام شد. صحت ژنهای شناسایی شده و کامل بودن توالی ORF آنها با استفاده از برنامه BLASTP مورد بررسی قرار گرفت. از آنجا که محتوای GC بر پایداری DNA، ساختار ثانویه mRNA و بر دمای اتصال DNA الگو در آزمایشات PCR اثر میگذارد، برای محاسبه محتوای GC از برنامه آنلاین Science Buddies استفاده شد (https://www.sciencebuddies.org).
همردیفی توالیها و روابط فیلوژنتیکی
جستجو بهمنظور شناسایی توالی پروتئینهای مشابه با استفاده ازبرنامه BLASTP انجام شد و پروتئینهای با همسانی بالا انتخاب شدند و همردیفی چندگانه بهوسیله برنامه ClustalW2 انجام شد (http://www.ebi.ac.uk/Tools/msa/clustalw2/). برای پیبردن به رابطه فیلوژنتیکی بین پروتئینهای مورد نظر و پروتئینهای مشابه، ترسیم درخت فیلوژنتیکی با استفاده از برنامه MEGA 7 و روش Neighbor joining انجام شد (Kumar et al., 2016).
خصوصیات پروتئینها
برای تعیین نقش مولکولی پروتئینها و شناسایی دمینهای حفاظتشده، از برنامه آنلاین InterProScan استفاده شد که منبع تجزیه و تحلیل عملکردی توالی پروتئین با طبقه بندی آنها به خانوادهها و پیشبینی حضور دمینها است. با استفاده از این برنامه، وجود دمینهای عملکردی پروتئینهای مورد نظر و همچنین عملکرد مولکولی و فرایند بیولوژیکی پروتئینها پیشبینی شدند (https://www.ebi.ac.uk/interpro). همچنین جستجو توالی پروتئینی موردنظر در کتابخانه موتیف سایت GenomeNet، با استفاده از ابزار MOTIF Search جهت شناسایی موتیفهای حفاظت شده انجام شد (https://www.genome.jp/tools/motif/). برای تعیین خصوصیات ساختار اولیه پروتئینها از ابزار ProtParam سایت ExPASy استفاده شد تا نقطه ایزوالکتریک[17]، وزن مولکولی[18]، فراوانی اسیدهای آمینه، تعداد اسیدآمینه با بار مثبت و منفی، میانگین آبگریزی کل[19] و شاخص ناپایداری [20] بررسی شود (https://web.expasy.org/protparam).
شکل 1- مسیر بیوسنتز توکوفرول در گیاهان. هموجنتیسیک اسید (HGA)؛ گرانیلگرانیل پیروفسفات (GGPP)؛ فایتیل پیروفسفات (PPP)؛ دیمتیل آلیل پیروفسفات(DMAPP) ؛ 3،2-دیمتیل-6-فایتیل-4،1-بنزوکوئینول (DMPBQ)؛ 4-هیدروکسی فنیل پیرووات (HPP)؛ ایزوپنتیل پیروفسفات (IPP)؛ 2-متیل-6-فایتیل-4،1-بنزوکوئینول (MPBQ)؛ p-هیدروکسی فنیل پیرووات دیاکسیژناز (HPPD)؛ هموجنتیسیک اسید فایتیل ترانسفراز (HPT یا VTE2)؛ گرانیلگرانیل پیروفسفات سنتاز (GGPPS)؛ گرانیلگرانیل ردوکتاز (GGR)؛ گاما توکوفرول متیل ترانسفراز (γ-TMT یا VTE4)؛ متیل ترانسفراز (MT یا VTE3)؛ توکوفرول سایکلاز (TC یا VTE1)؛ فیتول کیناز (VTE5)؛ فایتیل فسفات کیناز (VTE6) (Mene-Saffrane and Pellaud, 2017).
Figure 1. Tocopherol biosynthesis pathway in plants. homogentisic acid (HGA); geranylgeranyl pyrophosphate (GGPP); phytyl pyrophosphate (PPP); dimethylallyl pyrophosphate (DMAPP); 2,3-dimethyl-6-phytyl-1,4 benzoquinol (DMPBQ); 4-hydroxyphenylpyruvate (HPP); isopentenyl pyrophosphate (IPP); 2-methyl-6-phytyl-1,4-benzoquinol (MPBQ); p-hydroxyphenylpyruvate dioxygenase (HPPD); homogentisic acid Phytyl transferase (HPT/VTE2); Geranylgeranyl pyrophosphate synthase (GGPPS); geranylgeranyl reductase (GGR); γ -tocopherol methyltransferase (γ -TMT /VTE4); methyltransferase (MT/VTE3); tocopherol cyclase (TC/VTE1); phytol kinase (VTE5); phytyl phosphate kinase (VTE6) (Mene-Saffrane and Pellaud, 2017).
از آنجا که برنامه آنلاین DeepLoc-1.0 یک الگوریتم پیشبینی را با تکیه بر اطلاعات توالی ارائه میدهد و تمام توالی پروتئینی را پردازش میکند و مناطق پروتئینی مهم برای محل قرارگیری درون سلولی[21] را شناسایی میکند، جهت پیشبینی مکانیزم محل قرارگیری پروتئینهای یوکاریوتی درون سلول؛ از این برنامه استفاده شد (http://www.cbs.dtu.dk/services/DeepLoc).
نتایج و بحث
در نتیجه جستجو در کتابخانه Reads گیاه عدس موجود در پایگاه اطلاعاتی NCBI SRA مشخص شد که تعداد Readها برای هر ژن به این صورت است: HPPD (PDS1): 794، VTE5: 823، HPT (VTE2): 2990، VTE3 (APG1/IE35): 1887، TC (VTE1): 2611، γ-TMT (VTE4): 762. توالی توافقی حاصل از نرمافزار ORF finder در شش قالب خوانش آشکار برای هر شش ژن ترجمه شد و بلندترین ORF با ویژگیهای زیر برای هر یک از آنها انتخاب شد (جدول1). بهطور مثال، توالی کد کننده ژن HPPD از نوکلئوتید 126 تا 1433 به طول 1308 در رشته مثبت شناسایی شدند و طول پروتئین پیشبینی شده آن 435 اسیدآمینه است. محتوای GC را میتوان در طراحی پرایمر برای واکنشهای PCR، طراحی پیشبینی ساختار سنجاق سری برای mRNA و ... استفاده کرد.
جدول1- ویژگیهای ORFهای انتخاب شده و محتوای GC آنها
Table 1. Features of selected ORFs and their GC content.
Gene |
Label |
Strand |
Frame |
Start |
Stop |
Length (nt | aa) |
%G~C content |
HPPD VTE5 HPT VTE3 TC γ-TMT |
ORF5 ORF3 ORF2 ORF1 ORF1 ORF4 |
+ + + + + + |
3 3 2 1 1 3 |
126 84 311 241 109 15 |
1433 1010 1396 1278 1587 1070 |
1308 | 435 927 | 308 1086 | 361 1038 | 345 1479 | 492 1056 | 351 |
49.7 42.1 40.9 43.4 44 44.4 |
جستجوی توالی پروتئینهای ترجمه شده شش ژن مسیر بیوسنتزی توکوفرول در مقابل مجموعه نوکلئوتیدی Non-redundant (n/r) توانست Hit100 را در نتیجه BLASTP نشان دهد. همردیفی چندگانه توالی پروتئینها با برنامه Clustal Omega نشان داد که هومولوژی بالایی بین پروتئینهای پیشبینی شده و ده پروتئین مشابه دیگر از ژنهای شناسایی شده در خانواده حبوبات وجود دارد (شکل2).
HPPD.Ac --------MGKQTENE-------KEKEAQLKQPAPAGEFKLVGYANFVRTNPWSDRFQVK 45
HPPD.Bn --------MGHENAAVS------ESQHHDDAASAASPGFKLVGFSKFVRKNPKSDKFKVK 46
HPPD.Gm ----------------------MCNEIQAQAQAQAQPGFKLVGFKNFVRTNPKSDRFQVN 38
HPPD.Ls --------------------MGTEAKPSNVAGEQTGSAFKLVGFNNFIRTNPMSDKFSVK 40
HPPD.Cm --------MGKEAENVRASSEEAAAAAAAERVNAAESEFKLKGFKNFVRMNPKSDRFKVK 52
HPPD.Zj YPPASRRRV-----HSLHFSPERRSETETMGNENPAVDFKLVGFSNFVRSNPRSDRFKVK 115
HPPD.Mt ----------------------------MANETHNQTGFKLVGCKNFIRTNPKTDRFKVK 32
HPPD.Ca -----------------------------MGTIETQTGFKLVGFNNFVRTNPKSDRFKVK 31
HPPD.Lc ----------------------------MGNETENQTGFKLVGFKNFVRTNPKSDRFKVK 32
HPPD.Tp FPPHYKYCATHTNTNTKLF--TTKMAIETETQTQAQTGFKLLGFKNFVRANPKSDRFKVK 85
|
HPPD.Ts ------------------------MAIETETETQNQTGFKLRGFNNFVRANPKSDRFKVK 36
*** * :*:* ** :*:*.*:
HPPD.Ac RFHHVEFWCSDATNAALRFSWGLGMTLSAKSDLSTGNLTHASYLLRSGQLNFLFSAPYSP 105
HPPD.Bn RFHHIEFWCGDATNVARRFSWGLGMRFSAKSDLSTGNMVHASYLLTSGDLRFLFTAPYSP 106
HPPD.Gm RFHHIEFWCTDATNASRRFSWGLGMPIVAKSDLSTGNQIHASYLLRSGDLSFLFSAPYSP 98
HPPD.Ls RFHHIEFWCSDATNTARRFSWGLGMPIVQKSDLSTGNATHASYLLRSGQLNFLFTAPYSP 100
HPPD.Cm RFHHIEYWCTDATNTARRFSWGLGMPIVAKSDLSTGNLTHASYLLRSGQLCFLFTAPYSP 112
HPPD.Zj RFHHIEYWCGDATNTARRFSWGLGMPLVAKSDLSTGNQVHASYLLRSGDLCFLFTAPYSP 175
HPPD.Mt HFHHVEFWCTDATNTAHRFSHGLGMPIVAKSDLSTGNLTHASYLLRSGDLNFLFTAAYSP 92
HPPD.Ca RFHHVEFWCPDATNTARRFSWGLGMPIVAKSDLSTGNQTHASYLLRSGDLNFLFTAAYSP 91
HPPD.Lc RFHHVEFWCADATNTSRRFSWGLGMPIVAKSDLSTGNSTHASYLLRSGNLNFLFSAAYSP 92
HPPD.Tp RFHHVEFWCTDATNTARRFSWGLGMPIVAKSDLSTGNLKHASYLLRSGDLNFLFSAAYSP 145
HPPD.Ts RFHHVEFWCTDATNTARRFSWGLGMPIVAKSDLSTGNLKHASYLLRSGDLNFLFSAAYSP 96
:***:*:** ****.: *** **** : ******** ****** **:* ***:* ***
|
|||
HPPD.Ac SIAVANQLSPASTAAVPTFDRSACLAFLASHGLGVRAIAIEVEDAAAAFSASVAHGARPS 165
HPPD.Bn SLSAG----ETSTASIPSFDHVSCRSFFSSHGLGVRAVAIEVEDAESAFSISVANGAVPS 162
HPPD.Gm SLSAG--SSAASSASIPSFDAATCLAFAAKHGFGVRAIALEVADAEAAFSASVAKGAEPA 156
HPPD.Ls SISS---AVTSTTASIPSFSHTDCRNFTASHGLAVRSVAIEVEDAEIAFSVSVSHGAKPS 157
HPPD.Cm SIAAAQNLSPASTASIPSFDHAACRAFSGSHGLGVRAISLEVEDAEIAFRTSVAHGAKPS 172
HPPD.Zj SIASL--SQSPNSASIPSFDHSACRRFADSHGLAVRAVAIEVEDAELAFTTSVAHGAKPS 233
HPPD.Mt SISL---SSPSSTASIPTFSPSTCFSFSNSHGLNVRALAVEVEDAELAYTVSVSYGALPS 149
HPPD.Ca SISL---SAPHPTASIPSFSAPTSFAFSASHGLGVRAVAIEVDDAEFAYTTSVNHGAIPS 148
HPPD.Lc SLSL---SSPSSTASIPTFDAAASFAFSASHGLGVRAVAIEVEDAELAFTTSVAHGAIPA 149
HPPD.Tp SISL---SSPSSTASIPTFDASTCFAFSASHGLAVRAVAVEVEDAELAFTTSVNHGAIPV 202
HPPD.Ts SISL---SSPSSTASIPTFDASTCFAFSASHGLAVRAVAVEVEDAELAFTTSVNHGAIPA 153
|
*:: :*::*:*. . * .**: **::::** ** *: ** ** *
HPPD.Ac SPPVPLD-DHAVIAEVQLYGDVVLRYVSFKSCNS----SPNPNPEFLPGFEPVEES-ASF 219
HPPD.Bn SPPNVLN-GAVTIAEVKLYGDVVLRYVSYHNGA----------VNFLPGFESVDDTS-SF 210
HPPD.Gm SPPVLVD-DRTGFAEVRLYGDVVLRYVSYKDAAPQ-APHADPSRWFLPGFEAAASSSSFP 214
HPPD.Ls SSPITLGNNDVVLSEVKLYGDVVLRYISYKNPNFD------GISNFLPGFEPVEKTSSFP 211
HPPD.Cm SPPIVLD-NRAVLSEVHLYGDVVLRYISYKNPVSGDDSENKPDDWFLPKFEAMEEI-ASY 230
HPPD.Zj SPPLSLD-DRVAIAEVQLYGDVVLRYVSYKDPTRI--SDPNPDSWFLPGFESVP---SSF 287
HPPD.Mt SPPVVLE-NGVKLAEVRLFGDVVLRYVSYNNPNQN------QNLLFLPGFETLSGESSNS 202
HPPD.Ca SPPVVLD-NRVKLAEVQLYGDVVLRYVSYNDPIET--SNPNPNHWFLPGFEPVEETSSNQ 205
HPPD.Lc SPPVVLD-NRVKLAEVRLYGDVVLRYISYNNPNQT--SEPNPDQWFLPGFEPVSDESSQS 206
HPPD.Tp APPVNLE-NGVKLAEVRLYGDVVLRYVSYNNPNDNPNQNPDPNHWFLPGFESVSDESSNS 261
HPPD.Ts SSPVNLE-NGVKLAEVRLYGDVVLRYVSYNNPNDN----QNPNHWFLPGFESVSDESSNS 208
|
: * : . . ::**:*:*******:*::. *** **
HPPD.Ac PLDYGLRRLDHAVGNVPELAPMVEYVKKFTGFHEFAEFTAEDVGTTESGLNSLVLASNDE 279
HPPD.Bn PLDYGIRRLDHAVGNVPELGPALTYLAGFTGFHQFAEFTADDVGTAESGLNSAVLANNDE 270
HPPD.Gm ELDYGIRRLDHAVGNVPELAPAVRYLKGFSGFHEFAEFTAEDVGTSESGLNSVVLANNSE 274
HPPD.Ls DLDYGIRRLDHAVGNVPELAPAVDYVKSITGFHEFAEFTAEDVGTSESGLNSVVLACNSE 271
HPPD.Cm PLDFGIRRLDHAVGNVPELGPIVSYLKGFTGFHEFAEFTAEDVGTSESGLNSVVLANNEE 290
HPPD.Zj PLDFGIRRLDHAVGNVPELGPAVSYVKGFTGFHEFAEFTAEDVGTSDSGLNSVVLANNDE 347
HPPD.Mt SLDFGIRQLDHANGNVPELSSALKYIKQFTGFHDFAEFTAEDV---ESGLNAVALANNDE 259
HPPD.Ca SIDFGIQRLDHAVGNVPELSSALNYVKQFTGFHEFAEFTAEDVGTSESGLNSTVLANNEE 265
HPPD.Lc SLDFGIRRLDHAVGNVPELSSAIKYLKEFTGFHEFAEFTAEDVGTAESGLNSAVLANNEE 266
HPPD.Tp SLDFGIRRLDHAVGNVPELSSALKYLKEFTGFHEFAEFTAEDVGTSESGLNSVVLANNEE 321
HPPD.Ts SLDFGIRRLDHAVGNVPELSSALKYLKEFTGFHEFAEFTAEDVGTSESGLNSVVLANNEE 268
|
:*:*:::**** ******. : *: ::***:******:** :****: .** *.*
HPPD.Ac MVLLPMNEPVFGTKRKSQIQTYLEHNEGQGVQHLALMSEDIFRTLREMRRSSVGGFQFM 339
HPPD.Bn MVLLPVNEPVHGTKRKSQIQTFLEHNEGAGLQHLALMSEDIFRTLREMRKRSGVGGFDFM 330
HPPD.Gm TVLLPLNEPVYGTKRKSQIETYLEHNEGAGVQHLALVTHDIFTTLREMRKRSFLGGFEFM 334
HPPD.Ls MVLIPMNEPVYGTKRKSQIQTYLEHNEGAGVQHLALASEDIFRTLREMRKRSGIGGFEFM 331
HPPD.Cm MVLLPLNEPVYGTKRKSQIQTYLEHNEGAGVQHLALVSEDIFRTLREMRKRSGVGGFEFM 350
HPPD.Zj MVLLPLNEPVFGTKRKSQIQTYLEHNEGAGLQHLALVSEDIFRTLREMRSRSWIGGFEFM 407
HPPD.Mt TVLLPLCEPVYGTKRKSTIETYLEHNEGAGFQHLALASEDIFKTLREMRKRSGVGGFEFM 319
HPPD.Ca TVLLPMNEPVYGTKRKSQIQTYLEHNEGAGLQHLALMSNDIFKTLREMRKRSGIGGFEFM 325
HPPD.Lc TVLLPINEPVYGTKRKSQIETYLEHNEGAGLQHLALVSEDIFRTLREMRKRSGVGGFEFM 326
HPPD.Tp TVLFPMNEPVYGTKRKSQIETYLEHNEGAGLQHLALKSEDIFRTLREMRKRSGVGGFEFM 381
HPPD.Ts TVLFPMNEPVYGTKRKSQIETYLEHNEGAGLQHLALKSEDIFRTLREMRKRSSVGGFEFM 328
**:*: ***.****** *:*:****** *.***** :.*** ****** ** :***:**
HPPD.Ac PSPPPTYYRNLKNRAGDVLTDEQIKECEELGILVDRDDQGTLLQIFTKPVGDRPTLFIEI 399
HPPD.Bn PSPPPTYYKNLKKRIGDVLSDEQIRECEELGILVDRDDQGTLLQIFTKPLGDRPTIFIEI 390
HPPD.Gm PSPPPTYYANLHNRAADVLTVDQIKQCEELGILVDRDDQGTLLQIFTKPVGDRPTIFIXI 394
HPPD.Ls PSPPPTYYRNLKNRVGDVLTDEEIKECEELGILVDRDDQGTLLQIFTKPVGDRPTIFIEI 391
HPPD.Cm PSPPPTYYKNLKSRAGDVLTDDQIKECEELGILVDRDDQGTLLQIFTKPVGDRPTIFIEI 410
HPPD.Zj PSPPPTYYKNLKNRAGDVLTDEQIKECEELGILVDRDDQGTLLQIFTKPVGDRPTIFIEI 467
HPPD.Mt PSPPVTYYRNLKNRVGDVLSDEQIKECEELGILVDRDDQGTLLQIFTKPIGDRPTIFLEI 379
HPPD.Ca PSPPPTYYSNLKKRVGDVLNDEQIKECEELGILVDKDDQGTLLQIFTKPVGDRPTIFIEI 385
HPPD.Lc PSPPPTYYRNLKNRVGDVLNDEQIKECEELGILVDKDDQGTLLQIFTKPVGDRPTIFIEI 386
HPPD.Tp PSPPPTYYRNLKNRVGDVLSDEQIKECEELGILVDRDDQGTLLQIFTKPIGDRPTIFIEI 441
HPPD.Ts PSPPPTYYRNLKNRVGDVLNDEQIKECEELGILVDRDDQGTLLQIFTKPIGDRPTIFIEI 388
**** *** **:.* .***. ::*::*********:*************:*****:*: *
HPPD.Ac IQRVGCILKDDEGKAYQKGGCGGFGKGNFSELFKSIEEYEKTLEVKRITEPATA- 453
HPPD.Bn IQRVGCMKKDEEGKVYQSGGCGGFGKGNFSELFKSIEEYEKTLEAKQLVG----- 440
HPPD.Gm IQRIGCMVEDEEGKVYQKGACGGFGKGNFSELFKSIEEYEKTLEAKRTA------ 443
HPPD.Ls IQRVGCMVKDDEGKVQQKAGCGGFGKGNFSELFKSIEEYEKTLEARTTTEPTAAA 446
HPPD.Cm IQRVGCMMKNEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLEAKRVAEPTHSV 465
HPPD.Zj IQRVGCMLKDEEGKVYQKGGCGGFGKGNFSELFKSIEEYEKTLEAKQNAESDAA- 521
HPPD.Mt IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETRRTA------ 428
HPPD.Ca IQRVGCMLKDDEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLEIKRTA------ 434
HPPD.Lc IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETRRTA------ 435
HPPD.Tp IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETKRAA------ 490
HPPD.Ts IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETKRTA------ 437
***:**: :::*** *...************************ : .
شکل2- الف
VTE5.Bn RNVISQRLSRKLVHILSGLLFVLSWPIFSASKEARYFTALVPLVNCVRLVVNGLSISPNS 148
VTE5.Pa RNLIKQSLSRKLVHILSGLLFTLSWPIFSTSTSARYFALLVPLVNCLRLLVHGLSLVRDE 158
VTE5.Rc RNLLQQSLSRKLVHISSGLLFVLSWPIFSTSTEARYFASVVPLFNGLRLLLSGLSLVPNE 159
VTE5.Dz KQLIQQSLSRKLVHILSGLLFALSWPIFSNSYEARYFASLVPLLNCLRLVIHGLSLADDQ 150
VTE5.Sl RKLIEQNLSRKLVHILSGLLFMASWPIFSVSGRARYFAAVVPLTNCLRLVIHGLSLATDE 169
VTE5.Gs RAPPPSGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNCLRLLVNGLSLASDE 76
VTE5.Va RNILHQGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNCLRLLVNGLSLASDE 152
VTE5.Vr RNILHQGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNCLRLLVNGLSLASDE 152
VTE5.Ca KNILNQGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNFLRLLVNGLSLTSDQ 158
VET5.Lc RNFIDQGLSRKLVHILSGLLFLVSWPIFSNSSEARYFAAFVPLVNFLRLLVNGLSLVSDE 157
VTE5.Mt RNVIDQGLSRKLVHILSGLLFLVSWPIFSNSLEARYFAAFVPLVNFLRLLVNGLSLVTDP 155
: . ******** ***** ****** * ****: .*** * :**:: ***: :
VTE5.Bn TLIKSVTREGRPEELLRGPLFYVLALLVSAVFFWRDSPIGMISLAMMCGGDGIADIMGRK 208
VTE5.Pa GLIKSVTRDGNPEELLRGPLYYVLVLILCALFFWRESPVGVISMSMMCGGDGVADIMGRK 218
VTE5.Rc GLVKSVTREGNPKELLRGPLYYVLILILSALVFWRESPVGVISLAMMCGGDGVADIMGRR 219
VTE5.Dz GLIKSVTREGNPKELLRGPLYYVLILILCALVFWRESPTGVISLAMMCGGDGVADIMGRK 210
VTE5.Sl GLVKSVTREGKPEELLRGPLYYVLVLILSAVLFWRESPVGVISLAMMCGGDGIADIVGRR 229
VTE5.Gs GLIKSVTREGDPLELLRGPLYYVLILIFCALVFWRESPVGVVSLAMMCAGDGIADIIGRR 136
VTE5.Va GLIKSLTREGDPQELLRGPLYYVLILIFCALVFWRESPIGVVSLGMMCGGDGVADIIGRK 212
VTE5.Vr GLIKSLTREGDPQELLKGPLYYVLILIFCALVFWRESPIGVVSLGMMCGGDGVADIIGRK 212
VTE5.Ca GLIKSVTRKGDPKELLRGPLYYVVILMLCAVVFWRDSPIGVVSLAMMCGGDGVADIIGRR 218
VET5.Lc GLIKSVTRKGDPKELLRGPLYYVGILMLCAVVFWRQSPVGVVSLAMMCGGDGVADIIGRR 217
VTE5.Mt GLIKSVTRKGDPKELLRGPLYYVGILMLSALVFWRESPIGVVALAMMCGGDGVADIIGRR 215
*:**:**.* * ***:***:** *:..*:.***:** *::::.***.***:***:**:
VTE5.Bn FGSQKIPYNPRKSLAGSISMFIFGFIISIGLLYYYSSLGYLHMNWETTFTKVAIVSMVAT 268
VTE5.Pa FGSVKIPYNQSKSWAGSLSMFLFGFLVSLGMLYYYSALGYFQLDWSSTLQRVAAVSMVAT 278
VTE5.Rc FGSIKIPYNHRKSWAGSISMFVFGFLISLGMLYYYSILGYFNLDWMDTVQKVAFVSLVAT 279
VTE5.Dz FGSSKLPYNQSKSWVGSISMFVFGFFISMGMLYYFSVLGYFRLDWGWTIHRVALISLMAT 270
VTE5.Sl FGSTKLPYNKQKSLVGSLSMFVVGFLVSIGMLYYFSALGYFQLDWVSTVERVALVSFVAT 289
VTE5.Gs YGSLKIPYNQHKSLAGSMSMLVFGFLVSIGMLYYYSVLGHVQLDWASTVPRVAFISFVAT 196
VTE5.Va YGSIKIPYNQNKSWIGSISMLVFGFLVSIGILCYYSVLGHVQLDWASTVPRVAFISLVAT 272
VTE5.Vr YGSIKIPYNQNKSWVGSISMLVFGFLVSIGILCYYSVLGHVQLDWASTVPRVAFISFVAT 272
VTE5.Ca YGSMKIPYNQKKSWAGSISMLIFGFLVSIGMLYYYSALGHVQFDWWNIVPRVALVSIVAT 278
VET5.Lc YGSIKIPYNQKKSWAGSIAMFIFGFLVSIGMLYYYSALGHVEFNWDNILPRVAFVSIVAT 277
VTE5.Mt YGSMKIPYNQKKSWAGSIAMLIFGFLVSIGMLYYYSALGHVQFDLWNIVPRVAFVSFVAT 275
:** *:*** ** **::*::.**::*:*:* *:* **:..:: . :** :*::**
VTE5.Bn LVESLPITDQIDDNVSVPLATIMAAYVSFGY- 299
VTE5.Pa VVESLPISEVVDDNLSVPFASILAAYLSFNV- 309
VTE5.Rc VVESLPITKVVDDNISVPLASMAAAYFSFSL- 310
VTE5.Dz VVESLPITKLVDDNISVPLATMVAAYLSFRS- 301
VTE5.Sl MVESLPITGMVDDNISVPLVSMVVASLAFAY- 320
VTE5.Gs LVESLPITKVIDDNISVPLATMVVAFFTFHH- 227
VTE5.Va IVESLPITEIVDDNISVPLVTMAVAFFTFH-- 302
VTE5.Vr VVESLPITEIVDDNISVPLVTMAVAFSLFSNS 304
VTE5.Ca VVESLPITDVVDDNISVPLATIAVAFFTFHH- 309
VET5.Lc VVESLPITEVIDDNISVPLVTMALAFFVFHH- 308
VTE5.Mt VVESLPITEVVDDNISVPLVTMAVTFLTFHH- 306
:******: :***:***:.:: : *
شکل2- ب
HPT.Me ILNALDAFYRFSRPHTVIGTALSILSVSLLAVEKLSDLSPLFFTGVLEAVVAALLMNIYI 166
HPT.Jc VLNAIDAFYRFSRPHTVIGTALSILSVSLLAVEKLSDLSPLFFTGVLEAVAAALMMNIYI 169
HPT.Zj VKNGLDAFYRFSRPHTVIGTALSIVSVSLLAVEKLSDFSPLFFTGVLEAVAAALFMNIYI 164
HPT.Qs FKNALDAFYRFSRPHTVIGTVLSIVSVSLLAVEKLSDISPLFFTGVLEAVVAAFFMNIYI 165
HPT.Lc VKNSLDALYRFSRPHTVIGTALSIVSVSLLAVEKLSDISPLFFTGVLEAVVAALFMNIYI 171
HPT.Mt VKNSLDAFYRFSRPHTVIGTALSIISVSLLAAEKLSDISPLFFTGVLEAVVAALFMNIYI 170
HPT.Ad VKNSLDAFYRFSRPHTVIGTALSIVSVSLLAVQKSSDISPLFFTGVLEAVVAALFMNIYI 178
HPT.Ct VKNSLDAFYRFSRPHTVIGTALSIISVSLLALEKLSDISPMFFTGVLEAVVAALFMNIYI 166
HPT.Vr VKNSLDAFYRFSRPHTVIGTALSIISVSLLAVEKISDISPLFFTGVLEAVVAALFMNIYI 165
HPT.Gs VKNSLDAFYRFSRPHTVIGTALSIISVSLLAVEKISDISPLFFTGVLEAVVAALFMNIYI 95
HPT.Gm VKNSLDAFYRFSRPHTVIGTALSIISVSLLAVDKISDISPLFFTGVLEAVVAALFMNIYI 170
. *.:**:************.***:****** :* **:**:*********.**::*****
HPT.Me VGLNQLTDIEIDKVNKPYLPLASGEYSVGIGVMIIASFSMMSFWLGWVVGSWPLFWALFV 226
HPT.Jc VGLNQLSDIEIDKVNKPYLPLASGEYSTGTGVLIVTSFWIMSFWLGWVVGSWPLFWALFV 229
HPT.Zj VGLNQLYDIDIDKVNKPYLPLASGEYSVRTGIMIVSSFSIMSFFLGWIVGSWPLFWALFI 224
HPT.Qs VGLNQLSDIDIDKVNKPYLPLASGEYSVGTGVMIVTSFSILSFWLGWIVGSWPLFWALFI 225
HPT.Lc VGLNQLSDVEIDKINKPYLPLASGEYSFATGAIIVASSSILSFWLGWTVGSGPLLCALFT 231
HPT.Mt VGLNQLSDVEIDKINKPYLPLASGEYSFATGAIIVVSSSILSFWLAWIVGSWPLFWALFI 230
HPT.Ad VGLNQLSDIEIDKINKPYLPLASGEYSIGTGVTIVASFSLLSFWLGWIVGSWPLFWALFI 238
HPT.Ct VGLNQLSDVEIDKINKPYLPLASGEYSFGTGVTIVASFSVLSFWLCWIVGSWPLFWALFV 226
HPT.Vr VGLNQLSDVEIDKINKPYLPLASGEYSFGTGVAIVSSFSILSFGLSWIVGSWPLFWALFV 225
HPT.Gs VGLNQLSDVEIDKINKPYLPLASGEYSFETGVTIVASFSILSFWLGWVVGSWPLFWALFV 155
HPT.Gm VGSNQLFDVEIYKINKPYLPLASGEYSFETGVTIDASFSILSFWLGWVVGSWPLFWALFE 230
** *** *::* *:************* * * * ::** * * *** **: ***
HPT.Me SFVLGTAYSINLPLLRWKRFAFVAAMCILAVRAVIVQLAFYLHMQTHVYGRPAVFSRPLI 286
HPT.Jc SFVLGTAYSINLPLLRWKRSAFIAAMCILAVRAVIVQLAFFLHMQTHVYRRAAVFSRPLI 289
HPT.Zj SFMLGTAYSIKLPMLRWKRFALVAAMCILAVRAVIVQLAFFLHMQMHVYKRPAAFSRPLI 284
HPT.Qs SFLLGTAYSINVPLLRWKRFALVAAMCILAVRAVIVQLAFFLHIQTHVYKRPVVFSRPLI 285
HPT.Lc SFVLGTAYSINVPLLRWKRFALLAALCILSVRAVIVQLAFFLHMQTFVYKRPVVFSRSLI 291
HPT.Mt SFVLGTAYSINVPLLRWKRFAVLAAMCILSVRAVIVQLAFFLHMQTFVYKRPVVFSRPLI 290
HPT.Ad SFVLGTAYSIDVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPVVFSRPLI 298
HPT.Ct SFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPAVFSRPLI 286
HPT.Vr SFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPPVFSRPLI 285
HPT.Gs SFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPPVFSRPLI 215
HPT.Gm IFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHIQTHVYKRPPVFSRSLI 290
*:*******.:*:***** *.:**:***:**********:**:* .** * .*** **
HPT.Me FATAFMSFFSVVIALFKDIPDIEGDKIFGIRSFTVRLGQERVFWT-CISLLEIAYGVAIL 345
HPT.Jc FATAFMSFFSVVIALFKDIPDIEGDKIFGIQSFTVRLGQERVFWI-CISLLEIAYGVAIL 348
HPT.Zj FATAFMSFFSVVIALFKDIPDIDGDKIYGIQSFTVRLGQKRVFWI-CISLLEMAYGVAIM 343
HPT.Qs FATAFMSFFSVVIALFKDIPDIDGDKIYGIRSFSVRLGQQRVFWI-CISLLEMAYTVALL 344
HPT.Lc FATAFMSFFSVVIALFKDIPDIEGDRIFGIQSFSVRLGQKPVFWILCLPFLELAYGVALV 351
HPT.Mt FATAFMSFFSVVIALFKDIPDIEGDKIFGIQSFSVRLGQKRVFWI-CVTLLELAYGVSLV 349
HPT.Ad FATAFMSFFSVVIALFKDIPDIEGDRIFGIQSFSVRLGQQRVFWI-CVSLLEVAYGVALM 357
HPT.Ct FATAFMSFFSVVIALFKDIPDIEGDKIFGIQSFSVRLGQKRVFWI-CVSLLEIAYGVALM 345
HPT.Vr FATAFMSFFSVVIALFKDIPDIEGDKVFGIQSFSVRLGQKPVFWT-CVTLLEIAYGVALL 344
HPT.Gs FATAFMSFFSVVIALFKDIPDIEGDKVFGIQSFSVRLGQKPVFWT-CVTLLEIAYGVALL 274
HPT.Gm FATAFMSFFSVVIALFKDIPDIEGDKVFGIQSFSVRLSQKPVFWT-CVTLLEIAYGVALL 349
**********************:**:::**:**:***.*: *** *: :**:** *:::
HPT.Me VGAASSHTWSKCITVLGHAILASILWNRAKSVDLKSKAAITSCYMFIWKLFYAEYLLIPL 405
HPT.Jc VGAASSYTWSKCVTVVGHAILAAILWNRAKSVDLKSKAAITSCYMFIWKLFYAEYLLIPL 408
HPT.Zj VGASSGYFWSKIITVLGHIILASILWNQAKSVDLNSKAAITSYYMFIWKLFYAEYLLIPL 403
HPT.Qs VGIASSSLWSKLLTVVGHTILASVLWNRAKSVDLKSKDAITSFYMFIWKLFYVEYLLIPL 404
HPT.Lc VGVNIFFPME-------------------------------------------------- 361
HPT.Mt VGATSSCLWSKIVTSLGHAVLASILFNHAKSVDLKSKASITSFYMFIWKLFYAEYFLIPL 409
HPT.Ad VGAASPCLWSKIITGVGHAAMALILWFRAKSVDFKNKASITSFYMFIWKLFYAEYLLIPL 417
HPT.Ct VGAASPCLWSKAITGAGHAVLASLLWYQAKSVDLNTKASITSFYMFIWKLFYAEYLLLPY 405
HPT.Vr VGASSPCLWSKIFTGLGHAVLAAILWYQAKSVDLKSKASITSFYMFIWKLFYAEYLLIPF 404
HPT.Gs VGAASPCLWSKIFTGARRWVVILIN----------------------------------- 299
HPT.Gm VGAASPCLWSKIFTGLGHAVLASILWFHAKSVDLKSKASITSFYMFIWKLFYAEYLLIPF 409
** .
|
|
|
شکل2- پ
|
VTE3.Sp LAPICSI-----STSRPASQPRFIQHKQEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE 105
VTE3.Ca VAPKCSSSSSLSSASRPTSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE 116
VTE3.Lc LVPKCSSSV---SSSRPSSQPRFIQHKKEAYWFYRFLSIVYDHVVNPGHWTEDMRDEALE 111
VTE3.Mt IVVRSSSSV---SSSRPSSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE 113
VTE3.Rc1 LAPSCSI-----SSSRPASQPRFIQHKTEAFWFYRFLSIVYDHIINPGHWTEDMRDEALE 107
VTE3.Cc VVPKCSV-----SASRPSSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE 109
VTE3.Gm VVPKCSV-----SASRPTSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE 108
VTE3.Vr VLPKCSL-----SASRPSSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE 108
VTE3.Ac LAPKCSA-----SASRPASQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE 108
VTE3.Cm MAPKCSV-----SASRPASQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE 101
VTE3.Rc2 IAPKCSL-----SASRPASQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE 108
: .* *:***:********* **:************::***********:***
|
|
|
|
|
VTE3.Sp PADLNDRNLTVVDVGGGTGFTTLGIVEHVDAKNVTILDQSPHQLAKAKEKEPLKECKIIE 165
VTE3.Ca PADLNHRDMIVVDVGGGTGFTTLGIVKSVDAKNVTILDQSPHQLAKAKQKEPLKDCKIVE 176
VTE3.Lc PAELTDRNMLVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKEKEPLKDCKIIE 171
VTE3.Mt PAELTDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKEKEPLKDCKIVE 173
VTE3.Rc1 PADLYDRNMTVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKAPLKECKIIE 167
VTE3.Cc PADLSDRNMIVLDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLARAKQKEPLKDCKIVQ 169
VTE3.Gm PADLNDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKIIE 168
VTE3.Vr PADLNNRNMLVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKIIE 168
|
|
VTE3.Ac PADLSDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKVIE 168
|
VTE3.Cm PADLSDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEALKDCKIIE 161
|
|
VTE3.Rc2 PADLSDRNMLVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKIIE 168
|
**:* .*:: *:**************: *****************:**:* **:**:::
|
VTE3.Sp GDAEDLPFSTDYADRYVSAGS--------IEYWPDPQRGIREAYRVLKPGGKACLIGPVH 217
VTE3.Ca GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVH 228
VTE3.Lc GDAEDLPFKTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKIGGKACLIGPVH 223
VTE3.Mt GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKFGGKACLIGPVY 225
VTE3.Rc1 GDAEDLPFPTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKIGGKACLIGPVY 219
VTE3.Cc GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVY 221
VTE3.Gm GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGAKACLIGPVY 220
VTE3.Vr GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVY 220
VTE3.Ac GDAEDLPFCTDYADRYVSAGRICICNFLSIEYWPDPQRGVKEAYRVLKLGGKACLIGPVY 228
VTE3.Cm GDAEDLPFPTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVY 213
|
VTE3.Rc2 GDAEDLPFPTDYADRYVSAGS--------IEYWPDPQRGIREAYRVLKLGGKACLIGPVY 220
|
******** *********** **********::******* *.********:
|
|||||
VTE3.Sp PTFWLSRFFADVWMLFPKEEEYIEWFEKAGFTDVQLKKIGPKWYRGVRRHGLIMGCSVTG 277
VTE3.Ca PTFWLSRFFADVWMLFPTEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 288
VTE3.Lc PTFWLSRFFADVWMLFPTEEEYIEWFTKAGFKNVQLKRIGPKWYRGVRRHGLIMGCSVTG 283
VTE3.Mt PTFWLSRFFADVWMLFPKEEEYIEWFTKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 285
VTE3.Rc1 PTFWLSRFFADVWMLFPKEEEYIEWFKRAGFKDVKLKRIGPKWYRGVRRHGLIMGCSVTG 279
VTE3.Cc PTFWLSRFFADVWMLFPKEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 281
VTE3.Gm PTFWLSRFFADVWMLFPKEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 280
VTE3.Vr PTFWLSRFFADVWMLFPKEEEYIDWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 280
VTE3.Ac PTFWLSRFFADAWMLFPKEEEYIEWFKKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 288
VTE3.Cm PTFWLSRFFADVWMLFPKEEEYIQWFKNAGFTDVQLKRIGPKWYRGVRRHGLIMGCSVTG 273
VTE3.Rc2 PTFWLSRFFADVWMLFPKEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 280
***********.*****.*****:** .***.:*:**:**********************
VTE3.Sp VKSTPGDSPLQLGPKAEDVTKPVNPFVFMLRFLLGATAATYYVLVPIYMWVKDQVVPEGE 337
VTE3.Ca VKPASGDSPLQLGPKEEDVEKPIKPWVFLLRFALGTLAAAWFVLIPIYMWLKDQIVPKGQ 348
VTE3.Lc VKPASGDSPLQLGPKEEDVEKPVDPFVFLPRFILGVLAAAWFSLVPIYMWLKDQIVPKGQ 343
VTE3.Mt VKPASGDSPLQLGPKEEDVEKPVNPLVFLLRFALGILAASWYVLIPIYMWLKDQIVPKDQ 345
VTE3.Rc1 VKPLSGDSPLQLGPKAEDVKKPVNPFTFLLRFILGTIAATYYVLVPIYMWIKDQIVPKGM 339
VTE3.Cc VKPASGDSPLQLGPKEEDVEKPVNPFVFLMRFLLGAIAATWYVLVPIYMWLKDQVVPEGQ 341
VTE3.Gm VKPASGDSPLQLGPKEEDVEKSVNPFVFALRFVLGALAATWFVLVPIYMWLKDQVVPKGQ 340
VTE3.Vr VKPASGDSPLQLGPKEEDVEKPVNPFVFLMRFLLGALAATWFVLVPIYMWLKDQIVPKGQ 340
VTE3.Ac VKPASGDSPLQLGPKAEDVSKPTNPFVFLMRFILGAMAATYYVLVPIYMWIKDQLVPKGM 348
VTE3.Cm VKPSSGDSPLQLGPKEEDVSKPVNPFVFLGRFLLGAMAATYYVLVPIYMWIKDQIVPKGQ 333
VTE3.Rc2 VKPASGDSPLQLGPKEEDVSKPVNPFVFFLRFILGAMAATYYVLVPIYMWLKDQIVPKGR 340
** ********** *** * .* .* ** ** **::: *:*****:***:**:.
شکل2- ت
|
TC.Bn SIPRASASISTTNSDSSPSGNAINSEAISVKPVYVPTPPNRELRTPHSGYHFDGTARKFF 94
TC.Mt --I-------------AHNSHTEQQQSQSSKPIYSPTPPNRQLRTPHSGYHFDGTARKFF 84
TC.Lc --ALNSV----S---SHTDPIEDNQQSQSPKPIYSPTPPNRQLRTPHSGYHFDGTARKFF 96
TC.Tp --A---H----N---SHTDPIQDKQQSQSSKPIYSPTPPNRQLRTPHSGYHFDGTARKFF 92
TC.Ad --ATP-------KARPILCTAKTQSQQPTPPPTYSPTPPNRQLRTPHSG-----SARKFF 56
TC.Vr --AHASV----SDTVPLQNT-PQTPPSLTVKPTYSPTPPNRDLRTPHSGYHFDGTARKFF 97
TC.Gs --ARSFF----SDTVPIDNK-EKEQLVTSVKPTYSPTPPNRHLRTPHSGYHFDGTTRKFF 85
TC.Cc --VRSSV----SDTVPIDKN-QKEQ----LKPNYSPTPPNRDLRTPHSGYHFDGTARKFF 88
TC.Mn SQTNLRS----SAPDSVSEVRRDEEKSPSVSPVYTPTPPNRDLRTPHSGYHFDGTTRKFF 107
TC.Pp ----TKS----S--ISSSTTQQDKDSVSSVNPVYVPTPQNRDLRTPHSGYHFDGTNRKFF 96
TC.Jc ----SNS----RIFVSNSVTNPETEFLSSVSPVYAPTPPNRELRTPHSGYHFDGTTRQFF 106
|
* * *** **.******* : *:**
TC.Bn EGWYFRVSIPEKRESFCFMYSVENPAFRKRLSPLEVGLYGPRFTGVGAQILGANDKYLCQ 154
TC.Mt EGWYFKVSIPEKRQSFCFMYSVENPAFRKELSTLELAQYGPRFTGVGAQILGADDKYICQ 144
TC.Lc EGWYFKVSIPEKRQSFCFMYSVENPAFRKQLTTFELAQYGPRFTGVGAQILGADDKYICQ 156
TC.Tp EGWYFKVSIPERRQSFCFMYSVENPAFPKQLTTFELAQYGPRFTGVGAQILGADDKYICQ 152
TC.Ad EGWYFKVSIPERRQSFCFMYSVESPSFPRKLTPFEVTQYGPRFTGVGAQILGADDKYICQ 116
TC.Vr EGWYFRVSIPERRQSFCFMYSVESPSFRKPLTTLEQLQYGPRFTGVGAQILGADDKYICQ 157
TC.Gs EGWYFKLSIPERRQSFCFMYSVESPSFRKPLTPLEVAQYGSRFTGVGAQILGADDKYICQ 145
TC.Cc EGWYFKVSIPERRQSFCFMYSVESPSFRKPLTQLELAQFGSRFTGVGAQILGADDKYICQ 148
TC.Mn EGWYFKVSIPETKQSFCFMYSVENPAFRRKLSPWEVAQHGPRFTGVGAQILGAYDKYICQ 167
TC.Pp EGWYFKVSIPERRQSFCFMYSVENPAFRKKLTPLEVAQNGPRSTGVGAQILGAYDKYICQ 156
TC.Jc EGWYFKVSIPERKQSFCFMYSLENPAFRKKLTPFEVAQHGPRSTGVGAQILGAYDKYICQ 166
|
*****::**** ::*******:*.*:* : *: * * * ********** ***:**
TC.Bn YTEDSHNFWGDRHELVLGNTFSAMPGARSPDKEVPPEEFNRRVSEGFQATPFWHQGHICD 214
TC.Mt YTPQSPNFWGSRNELMLGNTFAAKQNSKPPNKEVPPKEFNDKVLEGFQVTPLWNQGFICD 204
TC.Lc YTPESHNFWGSRNELMLGNTFAAKPNSKPPKKEVDPKDFNDRVLEGFQVTPLWHQGSICD 216
TC.Tp YTQESNNFWGSRNELMLGNTFAAKQNSKPPNKEVPPKEFNDRVLEGFQVTPLWHQGFICD 212
TC.Ad FSEESQNFWGDRHELILGNTFVAKNNSRPPNKELPPQEFDNKVLEGFQVTPLWHQGFIRD 176
TC.Vr YSPESQFFWGSRHELMLGNTFVPNQNSKPPNKELPPQEFNDRVLEGFQVTPLWNQGFIQD 217
TC.Gs FSPESQFFWGSRHELMLGNTFVPNQNSKPPNKEVPPQEFNDRVLEGFQVSPLWHQGFIRD 205
TC.Cc YSPESQFFWGSRHELMLGNTFISKQNSKPPNKEVPPQEFNNRVVEGFQVTPLWNQGFIRD 208
TC.Mn FSEESQNFWGSRHELSLGNTFTAEKGQTPPNKEFPPQEFNRRVVEGFQVTPLWNQGFICD 227
TC.Pp YSEESQNFWGSRDELMLGNTFVAEKQLKPPNKEVPPKEFDRRVMEGFQVTPLWHQGSIRD 216
TC.Jc HVEESQNFWGNRHELVLGNTFVAEKGMQPPTKEVPPQDFSRRVSEGFQVTPLWHQGFIRD 226
|
. :* ***.*.** ***** * **. *::*. :* ****.:*:*:** * *
TC.Bn DGRTDYAETVKSARWEYSTRPVYGWGDVGTKQKSTAGWPAAFPVFEPHWQICMAGGLSTG 274
TC.Mt DGRSDYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG 264
TC.Lc DGRSNYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMGGGLSTG 276
TC.Tp DGRSNYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG 272
TC.Ad DRRSNYVETVETARWEYSTRPVYGWGNVGSAQKSTAGWLAAFPVFEPHWQICMAGGLSTG 236
TC.Vr DGRSDYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG 277
TC.Gs DGRSNYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG 265
TC.Cc DGRSDYVETVKTARWEYSTLPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAAGLSTG 268
TC.Mn DGRSDYVDVVKTARWEYSTRPVFGWGDVGSKQKSTAGWLAAFPVFEPHWQICMAGGLSTG 287
TC.Pp DGRSDYVETVPTARWEYSTRPVYGWGDVGSKQKSTAGWLAAFPVFEPHWQICMAGGLSTG 276
TC.Jc DGRSDYVQTVKTARWEYSTRPVYGWGDVGSKQKSTAGWLAAFPVFEPHWQICMAGGLSTG 286
|
* *::*.:.* :******* **:***:**: ******* **************..*****
TC.Bn --WIEWGDERFEFRDAPSYSEKNWGGGFPRKWFWVQCNVFEGAKGEIALTAAGGLRQLPG 332
TC.Mt --WIEWDGERIEFENAPSYSEKNWGGAFPRKWFWAQCNVFEGASGEIALTAAGGLRQIPG 322
TC.Lc --WIEWDGERIEFENAPSYSEKNWGGAFPRKWFWAQCNVFEGASGEVALTAAGGLRQIPG 334
TC.Tp MCWIEWDGERIEFENAPSYSEKNWGGAFPRKWFWAQCNVFEGASGEIALTAAGGLRQIPG 332
TC.Ad --WIEWDGERIEFNNAPSYSEKNWGGGFPRRWFWVQCNVFEGGSGEIALTAAGGLRQIPG 294
TC.Vr --WIEWDGERIEFENAPSYSEKNWGAGFPRKWFWAQCNVFEGGSGEIALTAAGGLRLIPG 335
TC.Gs S-WIEWDGKRIEFDNAPSYSEKNWGGGFPRKWFWVQCNVFEGASGEIALTAAGGLRQIPG 324
TC.Cc --WIEWDGERIEFDNAPSYSEKNWGGAFPRKWFWVQCNVFEGASGEIALTAAGGLRQIPG 326
TC.Mn --WIEWDGERFEFENAPSYCEKNWGGAFPRKWFWVQSNVFEGATGEVALTAAGGYRQIPG 345
TC.Pp --WIEWGGERFEFQNAPSYSEKNWGGAFPRKWFWVQCNVFEGASGEVALTAGGGLRQLPG 334
TC.Jc --WIEWDGERFEFKDAPSYSEKNWGAGFPRKWFWVQCNVFEGAIGEVALTAAGGLRQLPG 344
|
****..:*:** :****.*****..***:***.*.*****. **:****.** * :**
TC.Bn LTETFENAALVCVHYDGKLYEFVPWNGVVSWEMSPWGYWYMTAENETHM----------- 381
TC.Mt LTETFENAALIGIHYGGKFYEFVPWNGVVSWEVATWGYWFMSADNGNYVV---------- 372
TC.Lc LTETFENAALIGVHFGGKFYEFVPWNGVVTWEVATWGYWFMSADNGNYV----------- 383
TC.Tp LTETFENAALIGVHYGGKFYEFVPWNGVVSWEVATWGYWFMTADNGNYVMFKLRNLNILL 392
TC.Ad ITETYENAALIGVHYAGIFYEFVPWNGVVNWEVNPWGYWFMSADNGRHV----------- 343
TC.Vr ITETYENAALIGIHYDGKFYEFVPWNGVVNWEIATWGYWFISADNGKYV----------- 384
TC.Gs IAETFENAALIGIHYGGIFYEFVPWNGVVNWEVTTWGYWFMSADNGRYV----------- 373
TC.Cc ITETFENAALIGIHYGGKFYEFVPWNGVVNWEVATWGYWFMSADNGNYV----------- 375
TC.Mn LTETFENAALVGVHYGGKFYEFVPWNGVVSWEIASWGYWHLAGENNTHM----------- 394
TC.Pp LTETFENAALIGVHYGGKFYEFVPWYGDVSWEISPWGYWSIAAENETHK----------- 383
TC.Jc LTENFESAALIGVHYEGIFYEFVPWNGVLNWEISPWGYWFITAENKSHL----------- 393
|
::*.:*.***: :*: * :****** * :.**: **** ::.:* :
TC.Bn ------------------------------------VELEARTNEAGTPLRAPTSEAGLA 405
TC.Mt -------------------------------------ELEATTEDPGTTLRAPTSEAGLS 395
TC.Lc ------------------------------------VELEATADDPGTTLRAPTSEAGLS 407
TC.Tp MIAVGEGKQLNDLNSEHVNDCAIHTSKWDLLCATLTVELEATTDDPGTTLRAPTSEAGLS 452
TC.Ad ------------------------------------VELEARTDDPGTTLRAPTMEAGLA 367
TC.Vr ------------------------------------VELEATAEDPGTTLRAPTEEAGLA 408
TC.Gs ------------------------------------VEIEATTEDPGTTLRAPTAEAGLA 397
TC.Cc ------------------------------------VEIEATADDPGTALRAPTAEAGLS 399
TC.Mn ------------------------------------VELEATTQHSGTTLRAPTSEAGLA 418
TC.Pp ------------------------------------IELEATTEDSGTTLRAPTAESGLA 407
TC.Jc ------------------------------------VELKATTKDPGTTLRAPTTESGFA 417
|
*::* :.. ** ***** *:*::
TC.Bn TACKDSCYGELKLQIWERRYDGSKGKVIMEAKSSMAAVEIGGGPWFGTWKGDTSNTPELL 465
TC.Mt QACKDTCFGILKLKLWERRYDGSKGKIILDVTSDMAALEVGGGPWFNTWKGKTS-TPPVL 454
TC.Lc QACKDTCFGNLKLKLWERRYDGSKGKIILDVKSDMAALEVGGGPWFNTWKGKTS-TPPVL 466
TC.Tp QACKDTCFGILKLKLWERRYDGSKGKIILDVTSDMAALEVGGGPWFNTWKGKTS-TPPVL 511
TC.Ad PACKDTCFGILKLQIWERRYDGSKGKLILDVSSNMAALEVGGGPWFSPWKGQTS-TPAVL 426
TC.Vr PACKDTCFGILKLQMWERRYDGSKGKIILNVSSNMAALEVGGGPWFDTWKGKTS-TPAAL 467
TC.Gs PACKDTCFGDLKLQMWERRYDGSKGKIILDVSSNMAALEVGGGPWFNTWKGKTS-TPAAL 456
TC.Cc PACKDTCFGILQLKLWERRYDGSKGKIILDVSSNMAALEVGGGPWFSTWKGKTS-TPAVL 458
TC.Mn PVCKDTCFAVLKLQIWERKFDGSKGKIILDVTSDMAAAEVGGGPWFNTWKGKTA-TPESV 477
TC.Pp PACKDTCFGELKLQIWERRYDGSKGKLILDVKSNMAAVEVGGGPWFSTWKGKTS-TPELL 466
TC.Jc PACKDTCFGDLKLQIWERRYDGTKGKMILDVTSDMAAVEVGGGPWFNTWKGKTT-TPELL 476
.***:*:. *:*::***::**:***:*::..*.*** *:******. ***.*: ** :
TC.Bn KRSLQVPLDLESVFGWVPFFKPPGL- 490
TC.Mt SRAIGLPVDVDGLYNLFPLFKPPGL- 479
TC.Lc QRAIGLPIDVESIYNLFPLFKPPGFL 492
TC.Tp SRAIGLPVDVDGIYNLFPLFKPPGL- 536
TC.Ad KRALELPIDVDGFFNAVPLFKPPGL- 451
TC.Vr RSALQLPIDVDSIFNLVPLFKPPGL- 492
TC.Gs SRVLELPIDVEGIFNPVPLFKPPGL- 481
TC.Cc SRALQLPIDVEGIFNNIPLFKPPGL- 483
TC.Mn RQALNVPVDVEGFFNLAPFFKPPGL- 502
TC.Pp SRALRVPVDVEGAYNLVPLFKPPGL- 491
TC.Jc NRALNVPVDVEGIFNFLPLFKPPGL- 501
: :*:*::. :. *:*****:
شکل2- ث
|
||||
TMT.Aa -MASSTVGDVAVAGPVSEQQQQELRKGIAEFYDESSLMWENIWGEHMHHGYYDNDAVDVQ 59
TMT.Sl -----MNAVSSSSVEVGIQNQQELKKGIADLYDESSGIWEDIWGDHMHHGYYEPKS-SVE 112
TMT.Ga --------------AVSSSSTTTLQEGIAEFYDESSGIWEDIWGDHMHHGYYDPGS-DVS 94
TMT.Gh --------------AASSLSTTTLQEGIAEFYDQSSGIWEDIWGDHMHHGYYDPDS-NVS 94
TMT.Mn RRAAAT-EAQLDDDDHSGIMWKQLQKGIAEFYDESSTLWENIWGDHMHHGFYDPDS-SVS 110
TMT.Lc AVT-----TREQEIVLE-EEKKKLQLGIAEFYDESSGIWENIWGDHMHHGFYDPDS-TVS 99
TMT.Ts AVK-----TSKQEIVLEEEEKKKLQLGIAEFYDESSGIWENIWGDHMHHGYYDPDS-TVS 55
TMT.Va ----------MSAVEQHEKEKEKLQKGIAEFYDESSTIWENIWGDHMHHGFYDPDS-TVS 49
|
|
|
TMT.Gm2 --------MSVEQKAAGKEEEGKLQKGIAEFYDESSGIWENIWGDHMHHGFYDPDS-TVS 51
|
TMT.Gm1 SAASSERGEIVLEQKPKKDDKKKLQKGIAEFYDESSGLWENIWGDHMHHGFYDSDS-TVS 100
|
|
TMT.Gs -------------MAGKEEKEGKLQKGIAEFYDESSGLWENIWGDHMHHGFYDPDS-TVS 46
|
|
*: ***::**:** :**:***:*****:*: : *.
|
|
TMT.Aa LSDHRSAQIRMVEQALAFANL-QDDPEKKPKSIVDVGCGIGGSSRYLAKKYGAECCGITL 118
TMT.Sl LSDHRAAQIRMIEQALSFAAI--SDPAKKPTSIVDVGCGIGGSSRYLAKKYGATAKGITL 170
TMT.Ga GSDHRAAQIRMIEESLRFAGI-SDDPANRPKRIVDVGCGIGGSSRYLARKYGAKCQGITL 153
TMT.Gh GSDHPAAQIRMIEESLRFAGI-TEDPANKPKTIVDVGCGIGGSSRYLARKYGAKCQGITL 153
TMT.Mn LSDHRPAQIRMIDEALRFASLPE-----EPKNVVDVGCGIGGSSRYIASKYGAKCKGITL 165
TMT.Lc VSDHRQAQIRMIEQSLDFASLSSEDSTKWPKSVVDVGCGIGGSSRYLAKKFGASCVGITL 159
TMT.Ts VSDHRAAQI--------------QDPTKWPKTVVDVGCGIGGSSRYLAKKFGASCVGITL 101
TMT.Va VSDHRAAQIRMIEESLRFASL-SEEPTKWPKRIVDVGCGIGGSSRYLAEKFGATSVGITL 108
|
TMT.Gm2 VSDHRAAQIRMIQESLRFASLLSENPSKWPKSIVDVGCGIGGSSRYLAKKFGATSVGITL 111
|
|
TMT.Gm1 LSDHRAAQIRMIQESLRFASV-SEERSKWPKSIVDVGCGIGGSSRYLAKKFGATSVGITL 159
|
|
TMT.Gs LSDHRLAQIRMIQESLRFASV-SEERSKWPKSIVDVGCGIGGSSRYLAKKFGATSVGITL 105
|
*** *** *. :*************:* *:** . ****
|
TMT.Aa SPVQAERAQALADAQGLGDKVSFQVADALNQPFPDGKFDLVWSMESGEHMPDKLKFVSEL 178
|
|
TMT.Sl SPVQAERAQALADAQGLGDKVSFQVADALNQPFPDGQFDLVWSMESGEHMPNKEKFVGEL 230
TMT.Ga SPVQAGRANALANAQVLADQVCFEVADALNQPFPDDQFDLVWSMESGEHMPDKPKFVEEL 213
TMT.Gh SPVQAGRANALAKDQGLADKVSFQVADALNQPFPDDQFDLVWSMESGEHMPDKPKFVKEL 213
TMT.Mn SPVQAQRANALASSQSLSPQVSFQVADALDQPFADGKFDLVWSMESGEHMPDKSKFVSEL 225
TMT.Lc SPVQAERANALAAAQGLADKVSFQVADALEQPFPDGQFDLVWSMESGEHMPNKPKFVGEL 219
TMT.Ts SPVQAERANALAASQGLADKVSFQVADALEQPFPDGQFDLVWSMESGEHMPNKAKFVGEL 161
TMT.Va SPVQAQRANALAAAQGLAHKVSFQVADALQQPFPDGQFDLVWSMESGEHMPDKTKFVGEL 168
|
TMT.Gm2 SPVQAQRANSLAAAQGLADKVSFEVADALKQPFPDGKFDLVWSMESGEHMPDKAKFVGEL 171
|
|
TMT.Gm1 SPVQAQRANALAAAQGLADKVSFQVADALQQPFSDGQFDLVWSMESGEHMPDKAKFVGEL 219
|
TMT.Gs SPVQAQRANALAAAQGLDDKVSFEVADALKQPFPDGKFDLVWSMESGEHMPDKAKFVGEL 165
|
***** **::** * * :*.*:*****.*** *.:**************:* *** **
|
TMT.Aa VRVAAPGATIIIVTWCHRDLSPDEKSLRPEEQKILDKICSSFYLPAWCSTADYVKLLESL 238
|
TMT.Sl ARVAAPGGTIILVTWCHRDLSPSEESLTPEEKELLNKICKAFYLPAWCSTADYVKLLQSN 290
TMT.Ga VRVAAPGGTIIVVTWCHRDLGPSEESLQPWEQKLLNRICDAYYLPEWCSTSDYVKLFQSL 273
TMT.Gh ARVAAPGGTIIIVTWCHRDLGPSEEDLQPWEKKLLNRICNAYYLPEWCSTSDYVKLLQSL 273
TMT.Mn ARVAAPGGTIIIVTWCHRDLKPGEESLQPWEQTLLNKICDAFYLPAWCSTADYVRLMESL 285
TMT.Lc VRVAAPGGTIIIVTWCHRDLRPDEESLQPWEENLLKKICDSFYLPAWCSTAEYVKLLETM 279
TMT.Ts ARVAAPGGTIIIVTWCHRDLRPDEESLQPWEEKLLKKICDSFYLPAWCSTAEYVKLLETM 221
TMT.Va ARVAAPGGTIIIVTWCHRDLGPDEQSLKPWEQDLLKKICDAFYLPAWCSAADYIKLLKSL 228
TMT.Gm2 ARVAAPGGTIIIVTWCHRDLGPDEQSLLPWEQDLLKKICDSYYLPAWCSTSDYVKLLESL 231
TMT.Gm1 ARVAAPGATIIIVTWCHRDLGPDEQSLHPWEQDLLKKICDAYYLPAWCSTSDYVKLLQSL 279
TMT.Gs ARVAAPGATIIIVTWCHRELGPDEQSLHPWEQDLLKKICDAYYLPAWCSASDYVKLLQSL 225
.******.***:******:* *.*:.* * *: :*.:**.::*** ***:::*::*:::
TMT.Aa SLQDIKSADWSGNVAPFWPAVIKTALSWKGITSLLRSGWKTIRGAMVMPLMIEGFKKDII 298
TMT.Sl SLQDIKAEDWSENVAPFWPAVIKSALTWKGFTSVLRSGWKTIKAALAMPLMIEGYKKGLI 350
TMT.Ga SLQDIKAGDWTENVAPFWPAVIRSALTWKGFTSLLRSGLKTIKGALVMPLMIEGFQKGVI 333
TMT.Gh SLQDIKAADWTENVAPFWPAVIRSALTWKGFTSLLRSGLKTIKGALVMPLMIQGYQKGVI 333
TMT.Mn SLQDIKAADWSQYVAPFWPAVIRSALTWKGLTSLLRAGRKTIRGALAMPLMIEGYKKDLI 345
TMT.Lc SLQDIKSADWSPFVAPFWPAVIRSALTWKGFTSILRSGLKTIKGALAMPLMIEGFRKGVI 339
TMT.Ts SLQDIKSADWSPFVAPFWPAVIRSALTWKGFTSILRSGLKTIKGAFAMPLMIEGFRKGVI 281
TMT.Va SLQDIKSADWSPFVAPFWPAVIRSALTWNGLTSLLRSGVKTIKGALAMPLMIKGYKKGLI 288
TMT.Gm2 SLQDIKSADWSPFVAPFWPAVIRTALTWNGLTSLLRSGLKTIKGALAMPLMIKGYKKDLI 291
TMT.Gm1 SLQDIKSEDWSRFVAPFWPAVIRSAFTWKGLTSLLSSGQKTIKGALAMPLMIEGYKKDLI 339
TMT.Gs SLQDIKSEDWSRFVAPFWPAVIRSALTWNGLTSLLRSGLKAIKGALAMPLMIKGYKKNLI 285
******: **: *********::*::*:*:**:* :* *:*:.*:.*****:*::*.:*
TMT.Aa KFSIITCRKPE----- 309
TMT.Sl KFAIITCRKPE----- 361
TMT.Ga KFAIIACRKPAE---- 345
TMT.Gh KFAIITCRKPE----- 344
TMT.Mn KFAIITCRKPHQ---- 357
TMT.Lc KFAIITCRKPEN---- 351
TMT.Ts KFSIITCRKPENQEGQ 297
TMT.Va KFVIITCRKPE----- 299
TMT.Gm2 KFSIITCRKPE----- 302
TMT.Gm1 KFAIITCRKPE----- 350
TMT.Gs KFAIITCRKPE----- 296
** **:****
شکل2- ج
شکل 2- همردیفی چندگانه توالی پروتئینهای HPPD (الف)، VTE5 (ب)، HPT (پ)، VTE3 (ت)، TC (ث) و γ-TMT (ج) در عدس با ده پروتئین مشابه دیگر توسط برنامه Clustal Omega. ستارهها معرف اسیدآمینههای حفاظتشده در بین تمام پروتئینهای گیاهی هستند و شکافها نشاندهنده همردیفی بهینه بین تمام توالیهای مقایسه شده میباشد. با استفاده از نرمافزار InterProScan محدوده اسیدآمینه دمینها، زیردمینها و خانوادههای پروتئینی بهترتیب توسط مثلثهای قرمز و آبی، سبز و سیاه و موتیفها توسط خطوط رنگی با استفاده از ابزار MOTIF Search مشخص شدهاند.
Figure 2. Multiple sequence alignment of HPPD (a), VTE5 (b), HPT (c), VTE3 (d), TC (e) and γ-TMT (f) in lentil with ten similar proteins by Clustal Omega program. The asterisks indicate the residues conserved among all the aligned plant proteins. Gaps demonstrate optimal alignment among all compared sequences. Using the InterProScan software, the amino acid range of domains, subdomains and protein families are shown respectively by the red, blue, green and black triangles. Motifs are marked by color lines using the MOTIF Search tool.
نتایج بررسی هومولوژی بین پروتئینهای شناسایی شده و ده پروتئین مشابه آنها بعد از همردیفی با برنامه Clustal Omega و با E-value کمتر از یک نشان داد که پروتئینهای پیشبینی شده HPPD، VTE5، HPT، VTE3، TC و γ-TMT در گیاه عدس، بهترتیب هومولوژی 100، 99، 100، 80، 82 و 100 درصدی با همین پروتئینها در گیاهان نخود، نخود، یونجه، یونجه، شبدر، شبدر دارند (شکل 3).
جهت پیشبینی حضور دمینهای عملکردی پروتئینهای مورد نظر و خانوادههای پروتئینی آنها نیز از برنامه InterProScan استفاده شد. برای پروتئین HPPD مشخص شد از اسیدآمینه نه تا 433 متعلق به بالاخانواده Glyoxalase/Bleomycin resistance protein/Dihydroxybiphenyl dioxygenase است و دو دمین Vicinal oxygen chelate (VOC) در محدوده اسیدآمینه 137-33 و 374-214 و یک زیردمینGlyoxalase/fosfomycinresistance/dioxygenase از اسیدآمینه 214 تا 368 مشخص شد (شکل 2- الف). پروتئین VTE3 در محدوده اسیدآمینه 267-76 متعلق به بالاخانواده S-adenosyl-L-methionine-dependent methyltransferase میباشد و دارای یک دمین از اسیدآمینه 73 تا 282 با دو عملکرد Methyltransferase type 11 وSAM-binding methyltransferase MPBQ/MBSQ است (شکل 2- ت). دامنه اسیدآمینه 350-68 در پروتئین γ-TMT همانند پروتئین VTE3 مربوط به بالاخانواده S-adenosyl-L-methionine-dependent methyltransferase میباشد و این پروتئین دارای یک دمین حفاظتشده Methyltransferase type 11 از اسیدآمینه 133 تا 231 است (شکل 2- ج). همچنین برنامه MOTIF Search نشان داد که پروتئینهای HPPD، HPT، VTE3، TC و ᵧ-TMT به ترتیب سه، یک، یک، 12 و 15 موتیف حفاظتشده دارند که در جدول2 گفته شده است و عملکرد مولکولی پروتئینهای پیشبینیشده و فرایندهای زیستی که پروتئینها در انها دخیلاند برنامهی InterProScan در جدول 3 خلاصه شده است.
جدول3- تعیین عملکرد مولکولی و فرایند های زیستی با برنامه InterProScan
Table 3. Determination of the molecular function and biological process of proteins with InterProScan program
Protein |
Biological Process |
Molecular Function |
HPPD |
- Aromatic amino acid family metabolic process - Oxidation-reduction process |
-4-hydroxyphenylpyruvate dioxygenase activity - Oxidoreductase activity, acting on single donors with incorporation of molecular oxygen |
VTE5 |
None predicted. |
None predicted. |
HPT |
None predicted. |
Transferase activity, transferring alkyl or aryl (other than methyl) groups |
VTE3 |
Methylation |
Methyltransferase activity |
TC |
None predicted. |
Tocopherol cyclase activity |
γ-TMT |
Methylation |
Methyltransferase activity |
ترکیب اسیدهای آمینه در ساختار اولیه پروتئینها نشان داد که بالاترین فراوانی متعلق به لوسین، سرین، گلایسین و کمترین فراوانی متعلق به دو اسیدآمینه سلنوسیستئین و پیرولیزین است. شاخص ناپایداری بالای 40 نشان میدهد که پروتئین عمر بالایی ندارد. این موضوع حاکی از آن است که به این پروتئین فقط در زمان خاصی در سلول نیاز است و اگر شاخص ناپایداری پایینتر از 40 باشد، پروتئین پایدارتر است و بهصورت دائم مورداستفاده قرار میگیرد (جدول 4).
جدول 4- تعیین خصوصیات ساختار اولیه پروتئینها با ابزار ProtParam
Table 4. Characterization of primary structure of proteins with the ProtParam tool
GRAVY |
II |
number of charged residues |
aa composition (%) |
pI |
Mw (KDa) |
Protein |
||
positively |
negatively |
Min |
max |
|||||
-0.363 0.380 0.467 -0.242 -0.463 -0.148 |
41.54 41.32 44.66 39.59 36.58 56.82 |
45 29 29 45 48 37 |
58 20 23 37 51 40 |
Pyl & Sec (0) Pyl & Sec (0) Pyl & Sec (0) Pyl & Sec (0) Pyl & Sec (0) Pyl & Sec (0) |
Ser (9) Leu (11.7) Leu (11.6) Leu (8.4) Gly (9.1) Ser (10) |
5.31 9.66 8.83 9.09 6.34 6.27 |
48.11943 34.47431 40.06685 38.70770 55.24714 39.04769 |
HPPD VTE5 HPT VTE3 TC γ-TMT |
پیشبینی نتایج حاصل از مکانیزم محل قرارگیری پروتئینها در سلولهای یوکاریوتی برنامه آنلاین DeepLoc-1.0 نشان داد که به غیر از پروتئین HPPD که بهصورت محلول در سیتوپلاسم است، پنج پروتئین دیگر در فضای بین دو غشا پلاستیدها قرار میگیرند (جدول5).
جدول 5- تعیین محل استقرار پروتئینها در سلول با برنامه DeepLoc-1.0
Table 5. Determination of proteins subcellular localization with DeepLoc-1.0 program
Protein |
Localization |
Type |
HPPD VTE5 HPT VTE3 TC γ-TMT |
Cytoplasm Plastid plastid Plastid Plastid Plastid |
Soluble Membrane Membrane (integral component of membrane) Membrane Membrane Membrane |
شکل 3-الف
شکل 3- ب
شکل 3- پ
شکل 3- ت
شکل 3- ث
شکل 3- ج
شکل 3- آنالیز فیلوژنتیکی پروتئینهای HPPD (الف)، VTE5 (ب)، HPT (پ)، VTE3 (ت)، TC (ث) و γ-TMT (ج) در عدس که توسط نرم افزار MEGA 7 با مربعهای قرمز مشخص شدهاست.
Figure 3. Phylogenetic analysis of HPPD (a), VTE5 (b), HPT (c), VTE3 (d), TC (e) and γ-TMT (f) in lentil, by the MEGA 7 software with red squares is shown.
REFERENCES
[1] p-hydroxyphenylpyruvate dioxygenase
[2] Geranylgeranyl pyrophosphate
[3] Geranylgeranyl pyrophosphate synthase
[4] Methyl erythritol phosphate
[5] Phytyl pyrophosphate
[6] Geranylgeranyl reductase
[7] Phytol kinase
[8] Phytyl phosphate kinase
[9] Homogentisate phytyltransferase
[10] Methyltransferase
[11] Tocopherol cyclase
[12] γ-tocopherol methyl transferase
[13] Express Sequence Tag; EST
[14] National Center for Biotechnology Information
[15] Sequence Read Archive
[16] Reads
[17] Isoelectric point; pI
[18] Molecular Weight; Mw
[19] Grand average of hydropathicity; GRAVY
[20] Instability index
[21] protein subcellular localization
REFERENCES