شناسایی In Silico ژن‌های دخیل در بیوسنتز توکوفرول در گیاه عدس(Lens culinaris)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانش آموخته گروه زراعت و اصلاح نباتات، پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران

2 دانشیارگروه زراعت و اصلاح نباتات، پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران

3 استادیار گروه بیوتکنولوژی، دانشکده کشاورزی، دانشگاه تربیت مدرس، تهران، ایران

چکیده

توکوفرول­ها (ویتامین E)، گروهی از ترکیبات آلی هستند که فعالیت‌های حیاتی را در سلول‌های گیاهی فراهم می‌کنند؛ دستگاه فتوسنتزی را از خسارت اکسیداتیو نوری در امان نگه می‌دارند و باعث حفاظت غشای کلروپلاست از پروکسیداسیون لیپید می‌شوند؛ همچنین وجود آن‌ها در تغذیه انسانی ضروری است. در این تحقیق، شش ژن‌ دخیل در بیوسنتز توکوفرول­ها شامل HPPD/PDS1، VTE5، HPT/VTE2، VTE3/APG1/IE35، TC/VTE1، γ-TMT/VTE4 و فراورده‌های این ژن‌ها به کمک پایگاه­های اطلاعاتی و نرم‌افزارهای بیوانفورماتیک، به‌صورت In Silico در گیاه عدس شناسایی شدند که می‌توان پس از شناسایی و جداسازی ژن‌ها، آن‌ها را برای اهداف اصلاحی عدس از طریق بهنژادی سنتی یا روش‌های نوین زیست فناوری به‌کار برد ترسیم درخت فیلوژنتیکی با برنامه MEGA 7 نشان داد که اکثر این ژن‌ها در گیاه عدس با گیاهان هم‌خانواده خود مانند نخود و یونجه هومولوژی بالایی دارند. پیش‌بینی حضور دمین‌های حفاظت‌شده مشخص کرد که پروتئین HPPD دارای دو دمین و یک زیردمین و پروتئین­های γ-TMT و VTE3 هر کدام دارای یک دمین حفاظت‌شده می‌باشند. نتایج حاصل از توصیف پروتئین‌ها با استفاده از ابزار ProtParam تعیین کرد که بالاترین فراوانی از نظر ترکیب اسیدهای آمینه، به لوسین، سرین و گلایسین و کمترین فراوانی، به دو اسیدآمینه سلنوسیستئین و پیرولیزین تعلق داشت. با استفاده از برنامه DeepLoc-1.0 پیش‌بینی شد که به­غیر از پروتئین HPPD که محلول در سیتوپلاسم است، پنج پروتئین دیگر در فضای بین دو غشا پلاستیدها قرار می‌گیرند.

کلیدواژه‌ها


عنوان مقاله [English]

In Silico identification of genes involved in tocopherol biosynthesis in lentil (Lens culinaris) plant

نویسندگان [English]

  • Atefeh Majidi 1
  • Alireza Abbasi 2
  • Sajad Rashidi-Monfared 3
1 Department of Agronomy and Plant Breeding, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran
2 Department of Agronomy and Plant Breeding, College of Agriculture and Natural Resources, University of Tehran, Karaj, Iran
3 Department of Plant Breeding and Biotechnology, Faculty of Agriculture, Tarbiat Modares University, Tehran
چکیده [English]

Tocopherols (Vitamin E) are an important group of organic compounds that realize vital activities in plant cells. They protect the photosynthetic system from photooxidation damages and prevent the lipid peroxidation of the chloroplast membrane. The presence of this plant organic compound in human nutrition is essential. In this research, six genes involved in the biosynthesis pathway of vitamin E including HPPD/ PDS1, VTE5, HPT/ VTE2, VTE3/ APG1/ IE35, TC/ VTE1, γ-TMT/ VTE4 and their products are identified in lentil plant using databases and bioinformatics software. After this identification, genes are implemented for breeding purposes of lentil through traditional breeding or modern biotechnology methods. According to the phylogenetic tree obtained by the MEGA 7 program, it was observed that most of these genes in the lentil have high homology to legume plants such as chickpea and alfalfa. In addition, the prediction of the presence of conserved domains revealed that the HPPD protein had two domains and one subdomain, and each of the proteins γ-TMT and VTE3 had only one conserved domain. Moreover, the results of the proteins description using ProtParam tool showed that the highest frequency with respect to the amino acids belonged to leucine, serine and glycine; by contrast, selenocysteine and pyrrolysine had the lowest frequency. The use of the DeepLoc-1.0 program predicted that only HPPD proteins were soluble in the cytoplasm, while five other proteins were located in the intermembrane space.

کلیدواژه‌ها [English]

  • Bioinformatics
  • gene
  • lentil
  • protein
  • vitamin E

مقدمه

عدس (Lens culinaris) گیاهی از خانواده Fabaceae که بعد از سویا در میان حبوبات، بیشترین پروتئین (حدود 25 درصد) و کمترین روغن را دارد و به علت وجود پروتئین بالا، مواد معدنی، فیبر و کربوهیدارت‌ها، منبع غذایی مهمی برای انسان است. ساقه، کاه و کلش و پوسته غلاف این گیاه دارای ارزش غذایی بالایی است و برای مصرف دام‌های اهلی مناسب است (Muehlbauer et al., 2006; Yadav et al., 2007; Srivastava & Vasishtha, 2012).

توکوفرول­ها (ویتامین E)، گروهی از ترکیبات آلی هستند که به‌صورت مولکول‌های محلول در چربی، در ناحیه چربی‌دوست غشای سلولی قرار می‌گیرند. فعالیت بیولوژیکی هر یک از مشتقات ویتامینE، معیار توانایی یا استفاده کارکردی آن است (Mène-Saffrané & DellaPenna, 2010). ویتامین E تنها در موجودات فتوسنتز کننده و برخی از سیانوباکتری ها تولید می­شود؛ بنابراین منبع تامین آن در انسان، مصرف گیاهان است (Arango & Heise, 1998). توکوفرول در حفاظت دستگاه فتوسنتزی در برابر خسارت اکسیداتیو و حفاظت اسیدهای‌ چرب غیر‌اشباع از پروکسیداسیون لیپید در غشاهای کلروپلاست  نقش دارد (Hugly & Somerville, 1992). ویتامین E عملکرد‌های حیاتی متعددی شامل دفع فیزیکی اکسیژن منفرد، پاکسازی شیمیایی گونه‌های فعال اکسیژن متعدد و رادیکال‌های آزاد را در انسان انجام می‌دهد؛ همچنین یک آنتی‌اکسیدان قطع کننده زنجیره برای حفاظت اسیدهای چرب غیر‌اشباع از پراکسیداسیون لیپید است (Fryer, 1993; Bramley et al., 2000).

واحد ساختاری اصلی ویتامین E شامل یک حلقه کرومانول قطبی (۲-متیل-۶-هیدروکسی کرومانول) مشتق شده از مسیر شیکیمات و یک زنجیره جانبی هیدروفوبیک ۱۶ کربنه از گروه پرنیل است که از مسیر غیر موالونات مستقر در پلاستید مشتق می‌شود (Spitzer & Schweigert, 2007). بر پایه تعداد و موقعیت گروه متیل موجود در گروه سر کرومانول، چهار فرم متفاوت از توکوفرول‌ها (α-tocopherols، β، γ و δ) در گیاهان یافت شده‌اند (Mène-Saffrané & DellaPenna, 2010).

 HGA پیش‌ماده‌ همه‌ انواع ویتامین E است و توسط p-هیدروکسی فنیل پیرووات دی‌اکسیژناز (HPPD[1])، از مسیر شیکیمات تولید می‌شود (Mene-Saffrane & Pellaud, 2017). زنجیره جانبی پرنیل، توسط گرانیل‌گرانیل دی‌فسفات (GGPP[2]) تحت کاتالیزور گرانیل‌گرانیل پیروفسفات سنتاز (GGPPS[3]) از مسیر متیل اریتریتول فسفات (MEP[4]) تولید می‌شود (Ruiz‐Sola et al., 2016; Mene-Saffrane and Pellaud, 2017). برای سنتز توکوفرول، نیاز به کاهش GGPP به فایتیل پیروفسفات (PPP[5]) توسط یک گرانیل‌گرانیل ردوکتاز (GGR[6]) است. در دانه‌ها و برگ‌های آرابیدوپسیس، سنتز توکوفرول بیشتر به فیتول کیناز VTE5[7] و فایتیل فسفات کیناز VTE6[8] بستگی دارد که به‌طور پیوسته فیتول را به فایتیل پیروفسفات فسفوریله می‌کند (Valentin et al., 2006; Vom Dorp et al., 2015). در برگ‌های سالم، فیتول مورد استفاده برای سنتز توکوفرول اغلب از هیدرولیز کلروفیل تشکیل شده‌است (Vom Dorp et al., 2015).

گام مهم در بیوسنتز توکوکرومانول، تغلیظ HGA با یک زنجیره جانبی ایزوپرنوئیدی است که به‌وسیله پرنیل ترانسفراز انجام می‌گیرد. سنتز توکوفرول توسط یک هموجنتیسات فایتیل ترانسفراز (HPT[9]) آغاز می‌شود (Mene-Saffrane and Pellaud, 2017)؛ متیل فایتیل بنزوکوئینون‌ حاصل به‌وسیله متیل ترانسفراز (MT[10]) متیله می‌شود تا دی متیل فایتیل بنزوکوئینون را تشکیل دهد که هر دو فرم به‌وسیله توکوفرول سایکلاز (TC[11]) به‌ترتیب به دلتا توکوفرول و گاما توکوفرول تبدیل می‌شوند (شکل 1). این ایزوفرم‌ها توسط گاما توکوفرول متیل ترانسفراز (γ-TMT[12]) متیله می‌شوند و به‌ترتیب به بتا توکوفرول و آلفا توکوفرول تبدیل می‌شوند (Mene-Saffrane & Pellaud, 2017).

با توجه به تاثیر توکوفرول در گیاه و انسان، بررسی و مطالعه ژن‌های مرتبط با بیوسنتز توکوفرول اهمیت خاصی پیدا می‌کند. درحال حاضر در پایگاه NCBI، هیچ توالی نوکلئوتیدی از شش ژن‌ مذکور در این مسیر برای گیاه عدس به ثبت نرسیده‌ است که می‌توان پس از شناسایی و جداسازی ژن‌ها، آن‌ها را برای اهداف اصلاحی عدس از طریق بهنژادی سنتی یا روش‌های نوین زیست فناوری به‌کار برد.

 

مواد و روش‌ها

سرهمبندی خوانشها و شناسایی بیوانفورماتیکی ژن‌ها

در این پژوهش، برای شناسایی شش ژنHPPD/PDS1 ، VTE5،HPT/VTE2 ، VTE3/APG1/IE35، TC/VTE1، ᵧ-TMT/VTE4 به جستجو در کتابخانه Reads[13] گیاه عدس موجود در پایگاه اطلاعاتی NCBI[14] SRA[15] پرداخته شد (https://www.ncbi.nlm.nih.gov/sra/). با استفاده از برنامه Codon Code Aligner v.5.0.1 سرهمبندی خوانش‌ها[16] صورت گرفت و نهایتاً ترجمه توالی توافقی خروجی این نرم­افزار با استفاده از برنامه آنلاین ORF finder (https://www.ncbi.nlm.nih.gov/orffinder/) انجام شد. صحت ژن‌های شناسایی شده و کامل بودن توالی ORF آن‌ها با استفاده از برنامه BLASTP مورد بررسی قرار گرفت. از آن‌جا که محتوای GC بر پایداری DNA، ساختار ثانویه mRNA و بر دمای اتصال DNA الگو در آزمایشات PCR اثر می‌گذارد، برای محاسبه محتوای GC از برنامه آنلاین Science Buddies  استفاده شد (https://www.sciencebuddies.org).

هم‌ردیفی توالی‌ها و روابط فیلوژنتیکی

جستجو به‌منظور شناسایی توالی‌ پروتئین‌های مشابه با استفاده ازبرنامه BLASTP انجام شد و پروتئین‌های با همسانی بالا انتخاب شدند و هم‌ردیفی چندگانه به‌وسیله برنامه ClustalW2 انجام شد (http://www.ebi.ac.uk/Tools/msa/clustalw2/). برای پی‌بردن به رابطه‌ فیلوژنتیکی بین پروتئین‌های مورد نظر و پروتئین‌های مشابه، ترسیم درخت فیلوژنتیکی با استفاده از برنامه MEGA 7 و روش Neighbor joining انجام شد (Kumar et al., 2016).

خصوصیات پروتئین‌ها

برای تعیین نقش مولکولی پروتئین‌ها و شناسایی دمین‌های حفاظت‌شده، از برنامه­ آنلاین InterProScan استفاده شد که منبع تجزیه و تحلیل عملکردی توالی پروتئین با طبقه بندی آن‌ها به خانواده‌ها و پیش‌بینی حضور دمین‌ها است. با استفاده از این برنامه، وجود دمین­های عملکردی پروتئین‌های مورد نظر و همچنین عملکرد مولکولی و فرایند بیولوژیکی پروتئین‌ها پیش‌بینی شدند (https://www.ebi.ac.uk/interpro). همچنین جستجو توالی پروتئینی موردنظر در کتابخانه موتیف سایت GenomeNet، با استفاده از ابزار MOTIF Search جهت شناسایی موتیف‌های حفاظت شده انجام شد (https://www.genome.jp/tools/motif/). برای تعیین خصوصیات ساختار اولیه پروتئین‌ها از ابزار ProtParam سایت ExPASy استفاده شد تا نقطه ایزوالکتریک[17]، وزن مولکولی[18]، فراوانی اسیدهای آمینه، تعداد اسیدآمینه با بار مثبت و منفی، میانگین آب‌گریزی کل[19] و شاخص ناپایداری [20]  بررسی شود (https://web.expasy.org/protparam).

 

 
   


شکل 1- مسیر بیوسنتز توکوفرول در گیاهان. هموجنتیسیک اسید (HGA)؛ گرانیل‌گرانیل پیروفسفات (GGPP)؛ فایتیل پیروفسفات (PPP)؛ دی‌متیل آلیل پیروفسفات(DMAPP) ؛ 3،2-دی‌متیل-6-فایتیل-4،1-بنزوکوئینول (DMPBQ)؛ 4-هیدروکسی فنیل پیرووات (HPP)؛ ایزوپنتیل پیروفسفات (IPP)؛ 2-متیل-6-فایتیل-4،1-بنزوکوئینول (MPBQ)؛ p-هیدروکسی فنیل پیرووات دی‌اکسیژناز (HPPD)؛ هموجنتیسیک اسید فایتیل ترانسفراز (HPT یا VTE2)؛ گرانیل‌گرانیل پیروفسفات سنتاز (GGPPS)؛ گرانیل‌گرانیل ردوکتاز (GGR)؛ گاما توکوفرول متیل ترانسفراز (γ-TMT یا VTE4)؛ متیل ترانسفراز (MT یا VTE3)؛ توکوفرول سایکلاز (TC یا VTE1)؛ فیتول کیناز (VTE5)؛ فایتیل فسفات کیناز (VTE6) (Mene-Saffrane and Pellaud, 2017).

Figure 1. Tocopherol biosynthesis pathway in plants. homogentisic acid (HGA); geranylgeranyl pyrophosphate (GGPP); phytyl pyrophosphate (PPP); dimethylallyl pyrophosphate (DMAPP); 2,3-dimethyl-6-phytyl-1,4 benzoquinol (DMPBQ); 4-hydroxyphenylpyruvate (HPP); isopentenyl pyrophosphate (IPP); 2-methyl-6-phytyl-1,4-benzoquinol (MPBQ); p-hydroxyphenylpyruvate dioxygenase (HPPD); homogentisic acid Phytyl transferase (HPT/VTE2); Geranylgeranyl pyrophosphate synthase (GGPPS); geranylgeranyl reductase (GGR); γ -tocopherol methyltransferase (γ -TMT /VTE4); methyltransferase (MT/VTE3); tocopherol cyclase (TC/VTE1); phytol kinase (VTE5); phytyl phosphate kinase (VTE6) (Mene-Saffrane and Pellaud, 2017).

 

 

از آن‌جا که برنامه آنلاین DeepLoc-1.0 یک الگوریتم پیش‌بینی را با تکیه بر اطلاعات توالی ارائه می‌دهد و تمام توالی پروتئینی را پردازش می‌کند و مناطق پروتئینی مهم برای محل قرارگیری درون سلولی[21] را شناسایی می‌کند، جهت پیش­بینی مکانیزم محل قرارگیری پروتئین‌های یوکاریوتی درون سلول؛ از این برنامه استفاده شد (http://www.cbs.dtu.dk/services/DeepLoc).

 

نتایج و بحث

در نتیجه جستجو در کتابخانه­ Reads گیاه عدس موجود در پایگاه اطلاعاتی NCBI SRA مشخص شد که تعداد Readها برای هر ژن به این صورت است: HPPD (PDS1): 794، VTE5: 823، HPT (VTE2): 2990، VTE3 (APG1/IE35): 1887، TC (VTE1): 2611، γ-TMT (VTE4): 762. توالی توافقی حاصل از نرم­افزار ORF finder  در شش قالب خوانش آشکار برای هر شش ژن ترجمه شد و بلندترین ORF با ویژگی‌های زیر برای هر یک از آن‌ها انتخاب شد (جدول1). به‌طور مثال، توالی کد کننده ژن HPPD از نوکلئوتید 126 تا 1433 به طول 1308 در رشته مثبت شناسایی شدند و طول پروتئین پیش‌بینی شده‌ آن 435 اسیدآمینه است. محتوای GC را می‌توان در طراحی پرایمر برای واکنش‌های PCR، طراحی پیش‌بینی ساختار سنجاق سری برای mRNA و ... استفاده کرد.



جدول1- ویژگی‌های ORF‌های انتخاب شده و محتوای GC آن‌ها

Table 1. Features of selected ORFs and their GC content.

Gene

Label

Strand

Frame

Start

Stop

Length (nt | aa)

%G~C content

HPPD

VTE5

HPT

VTE3

TC

γ-TMT

ORF5

ORF3

ORF2

ORF1

ORF1

ORF4

+

+

+

+

+

+

3

3

2

1

1

3

126

84

311

241

109

15

1433

1010

1396

1278

1587

1070

1308 | 435

927 | 308

1086 | 361

1038 | 345

1479 | 492

1056 | 351

49.7

42.1

40.9

43.4

44

44.4

 

 

جستجوی توالی پروتئین‌های ترجمه شده شش ژن مسیر بیوسنتزی توکوفرول در مقابل مجموعه نوکلئوتیدی Non-redundant (n/r) توانست  Hit100 را در نتیجه BLASTP نشان دهد. هم‌ردیفی چندگانه توالی پروتئین‌ها با برنامه Clustal Omega نشان داد که هومولوژی بالایی بین پروتئین‌های پیش‌بینی شده و ده پروتئین مشابه دیگر از ژن‌های شناسایی شده در خانواده حبوبات وجود دارد (شکل2).

 

 

HPPD.Ac      --------MGKQTENE-------KEKEAQLKQPAPAGEFKLVGYANFVRTNPWSDRFQVK                     45

HPPD.Bn      --------MGHENAAVS------ESQHHDDAASAASPGFKLVGFSKFVRKNPKSDKFKVK                    46

HPPD.Gm      ----------------------MCNEIQAQAQAQAQPGFKLVGFKNFVRTNPKSDRFQVN  38

HPPD.Ls      --------------------MGTEAKPSNVAGEQTGSAFKLVGFNNFIRTNPMSDKFSVK     40

HPPD.Cm      --------MGKEAENVRASSEEAAAAAAAERVNAAESEFKLKGFKNFVRMNPKSDRFKVK        52

HPPD.Zj      YPPASRRRV-----HSLHFSPERRSETETMGNENPAVDFKLVGFSNFVRSNPRSDRFKVK               115

HPPD.Mt      ----------------------------MANETHNQTGFKLVGCKNFIRTNPKTDRFKVK                32

HPPD.Ca      -----------------------------MGTIETQTGFKLVGFNNFVRTNPKSDRFKVK                   31

HPPD.Lc      ----------------------------MGNETENQTGFKLVGFKNFVRTNPKSDRFKVK               32

HPPD.Tp      FPPHYKYCATHTNTNTKLF--TTKMAIETETQTQAQTGFKLLGFKNFVRANPKSDRFKVK        85

Glyoxalase_4

 

HPPD.Ts      ------------------------MAIETETETQNQTGFKLRGFNNFVRANPKSDRFKVK            36

*** *  :*:* ** :*:*.*:

HPPD.Ac      RFHHVEFWCSDATNAALRFSWGLGMTLSAKSDLSTGNLTHASYLLRSGQLNFLFSAPYSP   105

HPPD.Bn      RFHHIEFWCGDATNVARRFSWGLGMRFSAKSDLSTGNMVHASYLLTSGDLRFLFTAPYSP   106

HPPD.Gm      RFHHIEFWCTDATNASRRFSWGLGMPIVAKSDLSTGNQIHASYLLRSGDLSFLFSAPYSP      98

HPPD.Ls      RFHHIEFWCSDATNTARRFSWGLGMPIVQKSDLSTGNATHASYLLRSGQLNFLFTAPYSP       100

HPPD.Cm      RFHHIEYWCTDATNTARRFSWGLGMPIVAKSDLSTGNLTHASYLLRSGQLCFLFTAPYSP     112

HPPD.Zj      RFHHIEYWCGDATNTARRFSWGLGMPLVAKSDLSTGNQVHASYLLRSGDLCFLFTAPYSP   175

HPPD.Mt      HFHHVEFWCTDATNTAHRFSHGLGMPIVAKSDLSTGNLTHASYLLRSGDLNFLFTAAYSP   92

HPPD.Ca      RFHHVEFWCPDATNTARRFSWGLGMPIVAKSDLSTGNQTHASYLLRSGDLNFLFTAAYSP   91

HPPD.Lc      RFHHVEFWCADATNTSRRFSWGLGMPIVAKSDLSTGNSTHASYLLRSGNLNFLFSAAYSP    92

HPPD.Tp      RFHHVEFWCTDATNTARRFSWGLGMPIVAKSDLSTGNLKHASYLLRSGDLNFLFSAAYSP   145

HPPD.Ts      RFHHVEFWCTDATNTARRFSWGLGMPIVAKSDLSTGNLKHASYLLRSGDLNFLFSAAYSP   96

:***:*:** ****.: *** **** :  ********  ****** **:* ***:* ***

       
     
 

Glyoxalase_4

 
 

 

 

HPPD.Ac      SIAVANQLSPASTAAVPTFDRSACLAFLASHGLGVRAIAIEVEDAAAAFSASVAHGARPS       165

HPPD.Bn      SLSAG----ETSTASIPSFDHVSCRSFFSSHGLGVRAVAIEVEDAESAFSISVANGAVPS                  162

HPPD.Gm      SLSAG--SSAASSASIPSFDAATCLAFAAKHGFGVRAIALEVADAEAAFSASVAKGAEPA       156

HPPD.Ls      SISS---AVTSTTASIPSFSHTDCRNFTASHGLAVRSVAIEVEDAEIAFSVSVSHGAKPS                    157

HPPD.Cm      SIAAAQNLSPASTASIPSFDHAACRAFSGSHGLGVRAISLEVEDAEIAFRTSVAHGAKPS        172

HPPD.Zj      SIASL--SQSPNSASIPSFDHSACRRFADSHGLAVRAVAIEVEDAELAFTTSVAHGAKPS              233

HPPD.Mt      SISL---SSPSSTASIPTFSPSTCFSFSNSHGLNVRALAVEVEDAELAYTVSVSYGALPS                   149

HPPD.Ca      SISL---SAPHPTASIPSFSAPTSFAFSASHGLGVRAVAIEVDDAEFAYTTSVNHGAIPS                   148

HPPD.Lc      SLSL---SSPSSTASIPTFDAAASFAFSASHGLGVRAVAIEVEDAELAFTTSVAHGAIPA                 149

HPPD.Tp      SISL---SSPSSTASIPTFDASTCFAFSASHGLAVRAVAVEVEDAELAFTTSVNHGAIPV                  202

HPPD.Ts      SISL---SSPSSTASIPTFDASTCFAFSASHGLAVRAVAVEVEDAELAFTTSVNHGAIPA                  153

Glyoxalase_5

 

*::         :*::*:*.   .  *  .**: **::::** **  *:  **  ** *

 

HPPD.Ac      SPPVPLD-DHAVIAEVQLYGDVVLRYVSFKSCNS----SPNPNPEFLPGFEPVEES-ASF                  219

HPPD.Bn      SPPNVLN-GAVTIAEVKLYGDVVLRYVSYHNGA----------VNFLPGFESVDDTS-SF                      210

HPPD.Gm      SPPVLVD-DRTGFAEVRLYGDVVLRYVSYKDAAPQ-APHADPSRWFLPGFEAAASSSSFP     214

HPPD.Ls      SSPITLGNNDVVLSEVKLYGDVVLRYISYKNPNFD------GISNFLPGFEPVEKTSSFP                    211

HPPD.Cm      SPPIVLD-NRAVLSEVHLYGDVVLRYISYKNPVSGDDSENKPDDWFLPKFEAMEEI-ASY      230

HPPD.Zj      SPPLSLD-DRVAIAEVQLYGDVVLRYVSYKDPTRI--SDPNPDSWFLPGFESVP---SSF                   287

HPPD.Mt      SPPVVLE-NGVKLAEVRLFGDVVLRYVSYNNPNQN------QNLLFLPGFETLSGESSNS               202

HPPD.Ca      SPPVVLD-NRVKLAEVQLYGDVVLRYVSYNDPIET--SNPNPNHWFLPGFEPVEETSSNQ        205

HPPD.Lc      SPPVVLD-NRVKLAEVRLYGDVVLRYISYNNPNQT--SEPNPDQWFLPGFEPVSDESSQS          206

HPPD.Tp      APPVNLE-NGVKLAEVRLYGDVVLRYVSYNNPNDNPNQNPDPNHWFLPGFESVSDESSNS   261

HPPD.Ts      SSPVNLE-NGVKLAEVRLYGDVVLRYVSYNNPNDN----QNPNHWFLPGFESVSDESSNS          208

Glyoxalase_4

 

: *  :  . . ::**:*:*******:*::.              *** **

 

HPPD.Ac      PLDYGLRRLDHAVGNVPELAPMVEYVKKFTGFHEFAEFTAEDVGTTESGLNSLVLASNDE  279

HPPD.Bn      PLDYGIRRLDHAVGNVPELGPALTYLAGFTGFHQFAEFTADDVGTAESGLNSAVLANNDE  270

HPPD.Gm      ELDYGIRRLDHAVGNVPELAPAVRYLKGFSGFHEFAEFTAEDVGTSESGLNSVVLANNSE  274

HPPD.Ls      DLDYGIRRLDHAVGNVPELAPAVDYVKSITGFHEFAEFTAEDVGTSESGLNSVVLACNSE     271

HPPD.Cm      PLDFGIRRLDHAVGNVPELGPIVSYLKGFTGFHEFAEFTAEDVGTSESGLNSVVLANNEE     290

HPPD.Zj      PLDFGIRRLDHAVGNVPELGPAVSYVKGFTGFHEFAEFTAEDVGTSDSGLNSVVLANNDE    347

HPPD.Mt      SLDFGIRQLDHANGNVPELSSALKYIKQFTGFHDFAEFTAEDV---ESGLNAVALANNDE        259

HPPD.Ca      SIDFGIQRLDHAVGNVPELSSALNYVKQFTGFHEFAEFTAEDVGTSESGLNSTVLANNEE      265

HPPD.Lc      SLDFGIRRLDHAVGNVPELSSAIKYLKEFTGFHEFAEFTAEDVGTAESGLNSAVLANNEE       266

HPPD.Tp      SLDFGIRRLDHAVGNVPELSSALKYLKEFTGFHEFAEFTAEDVGTSESGLNSVVLANNEE      321

HPPD.Ts      SLDFGIRRLDHAVGNVPELSSALKYLKEFTGFHEFAEFTAEDVGTSESGLNSVVLANNEE      268

Glyoxalase_4

 

:*:*:::**** ******.  : *:  ::***:******:**   :****: .** *.*

 

HPPD.Ac      MVLLPMNEPVFGTKRKSQIQTYLEHNEGQGVQHLALMSEDIFRTLREMRRSSVGGFQFM     339

HPPD.Bn      MVLLPVNEPVHGTKRKSQIQTFLEHNEGAGLQHLALMSEDIFRTLREMRKRSGVGGFDFM  330

HPPD.Gm      TVLLPLNEPVYGTKRKSQIETYLEHNEGAGVQHLALVTHDIFTTLREMRKRSFLGGFEFM    334

HPPD.Ls      MVLIPMNEPVYGTKRKSQIQTYLEHNEGAGVQHLALASEDIFRTLREMRKRSGIGGFEFM     331

HPPD.Cm      MVLLPLNEPVYGTKRKSQIQTYLEHNEGAGVQHLALVSEDIFRTLREMRKRSGVGGFEFM 350

HPPD.Zj      MVLLPLNEPVFGTKRKSQIQTYLEHNEGAGLQHLALVSEDIFRTLREMRSRSWIGGFEFM       407

HPPD.Mt      TVLLPLCEPVYGTKRKSTIETYLEHNEGAGFQHLALASEDIFKTLREMRKRSGVGGFEFM     319

HPPD.Ca      TVLLPMNEPVYGTKRKSQIQTYLEHNEGAGLQHLALMSNDIFKTLREMRKRSGIGGFEFM   325

HPPD.Lc      TVLLPINEPVYGTKRKSQIETYLEHNEGAGLQHLALVSEDIFRTLREMRKRSGVGGFEFM      326

HPPD.Tp      TVLFPMNEPVYGTKRKSQIETYLEHNEGAGLQHLALKSEDIFRTLREMRKRSGVGGFEFM    381

HPPD.Ts      TVLFPMNEPVYGTKRKSQIETYLEHNEGAGLQHLALKSEDIFRTLREMRKRSSVGGFEFM     328

**:*: ***.****** *:*:****** *.***** :.*** ****** ** :***:**

       
       

 

 

HPPD.Ac      PSPPPTYYRNLKNRAGDVLTDEQIKECEELGILVDRDDQGTLLQIFTKPVGDRPTLFIEI            399

HPPD.Bn      PSPPPTYYKNLKKRIGDVLSDEQIRECEELGILVDRDDQGTLLQIFTKPLGDRPTIFIEI               390

HPPD.Gm      PSPPPTYYANLHNRAADVLTVDQIKQCEELGILVDRDDQGTLLQIFTKPVGDRPTIFIXI          394

HPPD.Ls      PSPPPTYYRNLKNRVGDVLTDEEIKECEELGILVDRDDQGTLLQIFTKPVGDRPTIFIEI              391

HPPD.Cm      PSPPPTYYKNLKSRAGDVLTDDQIKECEELGILVDRDDQGTLLQIFTKPVGDRPTIFIEI            410

HPPD.Zj      PSPPPTYYKNLKNRAGDVLTDEQIKECEELGILVDRDDQGTLLQIFTKPVGDRPTIFIEI              467

HPPD.Mt      PSPPVTYYRNLKNRVGDVLSDEQIKECEELGILVDRDDQGTLLQIFTKPIGDRPTIFLEI             379

HPPD.Ca      PSPPPTYYSNLKKRVGDVLNDEQIKECEELGILVDKDDQGTLLQIFTKPVGDRPTIFIEI            385

HPPD.Lc      PSPPPTYYRNLKNRVGDVLNDEQIKECEELGILVDKDDQGTLLQIFTKPVGDRPTIFIEI             386

HPPD.Tp      PSPPPTYYRNLKNRVGDVLSDEQIKECEELGILVDRDDQGTLLQIFTKPIGDRPTIFIEI               441

HPPD.Ts      PSPPPTYYRNLKNRVGDVLNDEQIKECEELGILVDRDDQGTLLQIFTKPIGDRPTIFIEI               388

**** *** **:.* .***. ::*::*********:*************:*****:*: *

 

HPPD.Ac      IQRVGCILKDDEGKAYQKGGCGGFGKGNFSELFKSIEEYEKTLEVKRITEPATA-                        453

HPPD.Bn      IQRVGCMKKDEEGKVYQSGGCGGFGKGNFSELFKSIEEYEKTLEAKQLVG-----                         440

HPPD.Gm      IQRIGCMVEDEEGKVYQKGACGGFGKGNFSELFKSIEEYEKTLEAKRTA------                           443

HPPD.Ls      IQRVGCMVKDDEGKVQQKAGCGGFGKGNFSELFKSIEEYEKTLEARTTTEPTAAA                   446

HPPD.Cm      IQRVGCMMKNEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLEAKRVAEPTHSV                465

HPPD.Zj      IQRVGCMLKDEEGKVYQKGGCGGFGKGNFSELFKSIEEYEKTLEAKQNAESDAA-                   521

HPPD.Mt      IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETRRTA------                             428

HPPD.Ca      IQRVGCMLKDDEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLEIKRTA------                             434

HPPD.Lc      IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETRRTA------                             435

HPPD.Tp      IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETKRAA------                            490

HPPD.Ts      IQRVGCMLKDEEGKEYQKGGCGGFGKGNFSELFKSIEEYEKTLETKRTA------                             437

***:**: :::***  *...************************ :  .

شکل2- الف

VTE5.Bn      RNVISQRLSRKLVHILSGLLFVLSWPIFSASKEARYFTALVPLVNCVRLVVNGLSISPNS           148

VTE5.Pa      RNLIKQSLSRKLVHILSGLLFTLSWPIFSTSTSARYFALLVPLVNCLRLLVHGLSLVRDE           158

VTE5.Rc      RNLLQQSLSRKLVHISSGLLFVLSWPIFSTSTEARYFASVVPLFNGLRLLLSGLSLVPNE           159

VTE5.Dz      KQLIQQSLSRKLVHILSGLLFALSWPIFSNSYEARYFASLVPLLNCLRLVIHGLSLADDQ          150

VTE5.Sl      RKLIEQNLSRKLVHILSGLLFMASWPIFSVSGRARYFAAVVPLTNCLRLVIHGLSLATDE          169

VTE5.Gs      RAPPPSGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNCLRLLVNGLSLASDE          76

VTE5.Va      RNILHQGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNCLRLLVNGLSLASDE         152

VTE5.Vr      RNILHQGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNCLRLLVNGLSLASDE         152

VTE5.Ca      KNILNQGLSRKLVHILSGLLFLVSWPIFSNSPKARYFAAFVPLVNFLRLLVNGLSLTSDQ         158

VET5.Lc      RNFIDQGLSRKLVHILSGLLFLVSWPIFSNSSEARYFAAFVPLVNFLRLLVNGLSLVSDE           157

VTE5.Mt      RNVIDQGLSRKLVHILSGLLFLVSWPIFSNSLEARYFAAFVPLVNFLRLLVNGLSLVTDP         155

:    . ******** *****  ****** *  ****: .*** * :**:: ***:  :

 

VTE5.Bn      TLIKSVTREGRPEELLRGPLFYVLALLVSAVFFWRDSPIGMISLAMMCGGDGIADIMGRK      208

VTE5.Pa      GLIKSVTRDGNPEELLRGPLYYVLVLILCALFFWRESPVGVISMSMMCGGDGVADIMGRK   218

VTE5.Rc      GLVKSVTREGNPKELLRGPLYYVLILILSALVFWRESPVGVISLAMMCGGDGVADIMGRR    219

VTE5.Dz      GLIKSVTREGNPKELLRGPLYYVLILILCALVFWRESPTGVISLAMMCGGDGVADIMGRK     210

VTE5.Sl      GLVKSVTREGKPEELLRGPLYYVLVLILSAVLFWRESPVGVISLAMMCGGDGIADIVGRR       229

VTE5.Gs      GLIKSVTREGDPLELLRGPLYYVLILIFCALVFWRESPVGVVSLAMMCAGDGIADIIGRR        136

VTE5.Va      GLIKSLTREGDPQELLRGPLYYVLILIFCALVFWRESPIGVVSLGMMCGGDGVADIIGRK        212

VTE5.Vr      GLIKSLTREGDPQELLKGPLYYVLILIFCALVFWRESPIGVVSLGMMCGGDGVADIIGRK        212

VTE5.Ca      GLIKSVTRKGDPKELLRGPLYYVVILMLCAVVFWRDSPIGVVSLAMMCGGDGVADIIGRR   218

VET5.Lc      GLIKSVTRKGDPKELLRGPLYYVGILMLCAVVFWRQSPVGVVSLAMMCGGDGVADIIGRR  217

VTE5.Mt      GLIKSVTRKGDPKELLRGPLYYVGILMLSALVFWRESPIGVVALAMMCGGDGVADIIGRR    215

*:**:**.* * ***:***:**  *:..*:.***:** *::::.***.***:***:**:

 

VTE5.Bn      FGSQKIPYNPRKSLAGSISMFIFGFIISIGLLYYYSSLGYLHMNWETTFTKVAIVSMVAT             268

VTE5.Pa      FGSVKIPYNQSKSWAGSLSMFLFGFLVSLGMLYYYSALGYFQLDWSSTLQRVAAVSMVAT 278

VTE5.Rc      FGSIKIPYNHRKSWAGSISMFVFGFLISLGMLYYYSILGYFNLDWMDTVQKVAFVSLVAT      279

VTE5.Dz      FGSSKLPYNQSKSWVGSISMFVFGFFISMGMLYYFSVLGYFRLDWGWTIHRVALISLMAT     270

VTE5.Sl      FGSTKLPYNKQKSLVGSLSMFVVGFLVSIGMLYYFSALGYFQLDWVSTVERVALVSFVAT    289

VTE5.Gs      YGSLKIPYNQHKSLAGSMSMLVFGFLVSIGMLYYYSVLGHVQLDWASTVPRVAFISFVAT    196

VTE5.Va      YGSIKIPYNQNKSWIGSISMLVFGFLVSIGILCYYSVLGHVQLDWASTVPRVAFISLVAT          272

VTE5.Vr      YGSIKIPYNQNKSWVGSISMLVFGFLVSIGILCYYSVLGHVQLDWASTVPRVAFISFVAT         272

VTE5.Ca      YGSMKIPYNQKKSWAGSISMLIFGFLVSIGMLYYYSALGHVQFDWWNIVPRVALVSIVAT   278

VET5.Lc      YGSIKIPYNQKKSWAGSIAMFIFGFLVSIGMLYYYSALGHVEFNWDNILPRVAFVSIVAT         277

VTE5.Mt      YGSMKIPYNQKKSWAGSIAMLIFGFLVSIGMLYYYSALGHVQFDLWNIVPRVAFVSFVAT    275

:** *:***  **  **::*::.**::*:*:* *:* **:..::    . :** :*::**

 

VTE5.Bn      LVESLPITDQIDDNVSVPLATIMAAYVSFGY-   299

VTE5.Pa      VVESLPISEVVDDNLSVPFASILAAYLSFNV-    309

VTE5.Rc      VVESLPITKVVDDNISVPLASMAAAYFSFSL-   310

VTE5.Dz      VVESLPITKLVDDNISVPLATMVAAYLSFRS-   301

VTE5.Sl      MVESLPITGMVDDNISVPLVSMVVASLAFAY-  320

VTE5.Gs      LVESLPITKVIDDNISVPLATMVVAFFTFHH-     227

VTE5.Va      IVESLPITEIVDDNISVPLVTMAVAFFTFH--         302

VTE5.Vr      VVESLPITEIVDDNISVPLVTMAVAFSLFSNS     304

VTE5.Ca      VVESLPITDVVDDNISVPLATIAVAFFTFHH-     309

VET5.Lc      VVESLPITEVIDDNISVPLVTMALAFFVFHH-     308

VTE5.Mt      VVESLPITEVVDDNISVPLVTMAVTFLTFHH-   306

:******:  :***:***:.::  :   *

شکل2- ب

 
   

 

 

HPT.Me      ILNALDAFYRFSRPHTVIGTALSILSVSLLAVEKLSDLSPLFFTGVLEAVVAALLMNIYI              166

HPT.Jc      VLNAIDAFYRFSRPHTVIGTALSILSVSLLAVEKLSDLSPLFFTGVLEAVAAALMMNIYI              169

HPT.Zj      VKNGLDAFYRFSRPHTVIGTALSIVSVSLLAVEKLSDFSPLFFTGVLEAVAAALFMNIYI              164

HPT.Qs      FKNALDAFYRFSRPHTVIGTVLSIVSVSLLAVEKLSDISPLFFTGVLEAVVAAFFMNIYI               165

HPT.Lc      VKNSLDALYRFSRPHTVIGTALSIVSVSLLAVEKLSDISPLFFTGVLEAVVAALFMNIYI              171

HPT.Mt      VKNSLDAFYRFSRPHTVIGTALSIISVSLLAAEKLSDISPLFFTGVLEAVVAALFMNIYI                170

HPT.Ad      VKNSLDAFYRFSRPHTVIGTALSIVSVSLLAVQKSSDISPLFFTGVLEAVVAALFMNIYI              178

HPT.Ct      VKNSLDAFYRFSRPHTVIGTALSIISVSLLALEKLSDISPMFFTGVLEAVVAALFMNIYI                166

HPT.Vr      VKNSLDAFYRFSRPHTVIGTALSIISVSLLAVEKISDISPLFFTGVLEAVVAALFMNIYI                  165

HPT.Gs      VKNSLDAFYRFSRPHTVIGTALSIISVSLLAVEKISDISPLFFTGVLEAVVAALFMNIYI                  95

HPT.Gm      VKNSLDAFYRFSRPHTVIGTALSIISVSLLAVDKISDISPLFFTGVLEAVVAALFMNIYI                170

. *.:**:************.***:****** :* **:**:*********.**::*****

 

HPT.Me      VGLNQLTDIEIDKVNKPYLPLASGEYSVGIGVMIIASFSMMSFWLGWVVGSWPLFWALFV     226

HPT.Jc      VGLNQLSDIEIDKVNKPYLPLASGEYSTGTGVLIVTSFWIMSFWLGWVVGSWPLFWALFV       229

HPT.Zj      VGLNQLYDIDIDKVNKPYLPLASGEYSVRTGIMIVSSFSIMSFFLGWIVGSWPLFWALFI              224

HPT.Qs      VGLNQLSDIDIDKVNKPYLPLASGEYSVGTGVMIVTSFSILSFWLGWIVGSWPLFWALFI          225

HPT.Lc      VGLNQLSDVEIDKINKPYLPLASGEYSFATGAIIVASSSILSFWLGWTVGSGPLLCALFT              231

HPT.Mt      VGLNQLSDVEIDKINKPYLPLASGEYSFATGAIIVVSSSILSFWLAWIVGSWPLFWALFI              230

HPT.Ad      VGLNQLSDIEIDKINKPYLPLASGEYSIGTGVTIVASFSLLSFWLGWIVGSWPLFWALFI              238

HPT.Ct      VGLNQLSDVEIDKINKPYLPLASGEYSFGTGVTIVASFSVLSFWLCWIVGSWPLFWALFV          226

HPT.Vr      VGLNQLSDVEIDKINKPYLPLASGEYSFGTGVAIVSSFSILSFGLSWIVGSWPLFWALFV             225

HPT.Gs      VGLNQLSDVEIDKINKPYLPLASGEYSFETGVTIVASFSILSFWLGWVVGSWPLFWALFV         155

HPT.Gm      VGSNQLFDVEIYKINKPYLPLASGEYSFETGVTIDASFSILSFWLGWVVGSWPLFWALFE        230

** *** *::* *:*************   *  *  *  ::** * * *** **: ***

 

HPT.Me      SFVLGTAYSINLPLLRWKRFAFVAAMCILAVRAVIVQLAFYLHMQTHVYGRPAVFSRPLI       286

HPT.Jc      SFVLGTAYSINLPLLRWKRSAFIAAMCILAVRAVIVQLAFFLHMQTHVYRRAAVFSRPLI           289

HPT.Zj      SFMLGTAYSIKLPMLRWKRFALVAAMCILAVRAVIVQLAFFLHMQMHVYKRPAAFSRPLI      284

HPT.Qs      SFLLGTAYSINVPLLRWKRFALVAAMCILAVRAVIVQLAFFLHIQTHVYKRPVVFSRPLI           285

HPT.Lc      SFVLGTAYSINVPLLRWKRFALLAALCILSVRAVIVQLAFFLHMQTFVYKRPVVFSRSLI            291

HPT.Mt      SFVLGTAYSINVPLLRWKRFAVLAAMCILSVRAVIVQLAFFLHMQTFVYKRPVVFSRPLI          290

HPT.Ad      SFVLGTAYSIDVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPVVFSRPLI        298

HPT.Ct      SFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPAVFSRPLI         286

HPT.Vr      SFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPPVFSRPLI         285

HPT.Gs      SFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHMQTHVYKRPPVFSRPLI         215

HPT.Gm      IFVLGTAYSINVPLLRWKRFAVLAAMCILAVRAVIVQLAFFLHIQTHVYKRPPVFSRSLI           290

*:*******.:*:***** *.:**:***:**********:**:* .** *  .*** **

 

HPT.Me      FATAFMSFFSVVIALFKDIPDIEGDKIFGIRSFTVRLGQERVFWT-CISLLEIAYGVAIL                   345

HPT.Jc      FATAFMSFFSVVIALFKDIPDIEGDKIFGIQSFTVRLGQERVFWI-CISLLEIAYGVAIL                      348

HPT.Zj      FATAFMSFFSVVIALFKDIPDIDGDKIYGIQSFTVRLGQKRVFWI-CISLLEMAYGVAIM                343

HPT.Qs      FATAFMSFFSVVIALFKDIPDIDGDKIYGIRSFSVRLGQQRVFWI-CISLLEMAYTVALL                344

HPT.Lc      FATAFMSFFSVVIALFKDIPDIEGDRIFGIQSFSVRLGQKPVFWILCLPFLELAYGVALV                351

HPT.Mt      FATAFMSFFSVVIALFKDIPDIEGDKIFGIQSFSVRLGQKRVFWI-CVTLLELAYGVSLV                349

HPT.Ad      FATAFMSFFSVVIALFKDIPDIEGDRIFGIQSFSVRLGQQRVFWI-CVSLLEVAYGVALM              357

HPT.Ct      FATAFMSFFSVVIALFKDIPDIEGDKIFGIQSFSVRLGQKRVFWI-CVSLLEIAYGVALM                345

HPT.Vr      FATAFMSFFSVVIALFKDIPDIEGDKVFGIQSFSVRLGQKPVFWT-CVTLLEIAYGVALL               344

HPT.Gs      FATAFMSFFSVVIALFKDIPDIEGDKVFGIQSFSVRLGQKPVFWT-CVTLLEIAYGVALL              274

HPT.Gm      FATAFMSFFSVVIALFKDIPDIEGDKVFGIQSFSVRLSQKPVFWT-CVTLLEIAYGVALL              349

**********************:**:::**:**:***.*: ***  *: :**:** *:::

 

HPT.Me      VGAASSHTWSKCITVLGHAILASILWNRAKSVDLKSKAAITSCYMFIWKLFYAEYLLIPL         405

HPT.Jc      VGAASSYTWSKCVTVVGHAILAAILWNRAKSVDLKSKAAITSCYMFIWKLFYAEYLLIPL       408

HPT.Zj      VGASSGYFWSKIITVLGHIILASILWNQAKSVDLNSKAAITSYYMFIWKLFYAEYLLIPL              403

HPT.Qs      VGIASSSLWSKLLTVVGHTILASVLWNRAKSVDLKSKDAITSFYMFIWKLFYVEYLLIPL          404

HPT.Lc      VGVNIFFPME--------------------------------------------------                         361

HPT.Mt      VGATSSCLWSKIVTSLGHAVLASILFNHAKSVDLKSKASITSFYMFIWKLFYAEYFLIPL            409

HPT.Ad      VGAASPCLWSKIITGVGHAAMALILWFRAKSVDFKNKASITSFYMFIWKLFYAEYLLIPL         417

HPT.Ct      VGAASPCLWSKAITGAGHAVLASLLWYQAKSVDLNTKASITSFYMFIWKLFYAEYLLLPY      405

HPT.Vr      VGASSPCLWSKIFTGLGHAVLAAILWYQAKSVDLKSKASITSFYMFIWKLFYAEYLLIPF          404

HPT.Gs      VGAASPCLWSKIFTGARRWVVILIN-----------------------------------  299

HPT.Gm      VGAASPCLWSKIFTGLGHAVLASILWFHAKSVDLKSKASITSFYMFIWKLFYAEYLLIPF         409

**       .

PCMT

 

Met_10

 

GidB

 

شکل2- پ

       
     
   
 

 

 

Methyltransf_23

 

VTE3.Sp       LAPICSI-----STSRPASQPRFIQHKQEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE                105

VTE3.Ca       VAPKCSSSSSLSSASRPTSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE       116

VTE3.Lc       LVPKCSSSV---SSSRPSSQPRFIQHKKEAYWFYRFLSIVYDHVVNPGHWTEDMRDEALE         111

VTE3.Mt       IVVRSSSSV---SSSRPSSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE             113

VTE3.Rc1      LAPSCSI-----SSSRPASQPRFIQHKTEAFWFYRFLSIVYDHIINPGHWTEDMRDEALE                 107

VTE3.Cc       VVPKCSV-----SASRPSSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE           109

VTE3.Gm       VVPKCSV-----SASRPTSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE          108

VTE3.Vr       VLPKCSL-----SASRPSSQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE             108

VTE3.Ac       LAPKCSA-----SASRPASQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE            108

VTE3.Cm       MAPKCSV-----SASRPASQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDEALE         101

VTE3.Rc2      IAPKCSL-----SASRPASQPRFIQHKKEAFWFYRFLSIVYDHVINPGHWTEDMRDDALE            108

:   .*      *:***:********* **:************::***********:***

       
     
   
 

 

 

 

Methyltransf_11               

 

Methyltransf_31

 

Methyltransf_12

 

Methyltransf_25               

 

Ubie_methyltran

 

VTE3.Sp       PADLNDRNLTVVDVGGGTGFTTLGIVEHVDAKNVTILDQSPHQLAKAKEKEPLKECKIIE    165

VTE3.Ca       PADLNHRDMIVVDVGGGTGFTTLGIVKSVDAKNVTILDQSPHQLAKAKQKEPLKDCKIVE 176

VTE3.Lc       PAELTDRNMLVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKEKEPLKDCKIIE   171

VTE3.Mt       PAELTDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKEKEPLKDCKIVE  173

VTE3.Rc1      PADLYDRNMTVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKAPLKECKIIE 167

VTE3.Cc       PADLSDRNMIVLDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLARAKQKEPLKDCKIVQ  169

VTE3.Gm       PADLNDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKIIE 168

VTE3.Vr       PADLNNRNMLVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKIIE  168

Met_10

 

GidB

 

VTE3.Ac       PADLSDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKVIE  168

Methyltransf_2

 

VTE3.Cm       PADLSDRNMIVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEALKDCKIIE 161

RrnaAD

 

Methyltransf_23

 

VTE3.Rc2      PADLSDRNMLVVDVGGGTGFTTLGIVKHVDAKNVTILDQSPHQLAKAKQKEPLKECKIIE 168

Methyltransf_12

 

**:* .*:: *:**************: *****************:**:*  **:**:::

           
       
 
   
 
   
 
   
 
   
 

 

 

 

Methyltransf_11               

 

VTE3.Sp       GDAEDLPFSTDYADRYVSAGS--------IEYWPDPQRGIREAYRVLKPGGKACLIGPVH               217

VTE3.Ca       GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVH              228

VTE3.Lc       GDAEDLPFKTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKIGGKACLIGPVH               223

VTE3.Mt       GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKFGGKACLIGPVY              225

VTE3.Rc1      GDAEDLPFPTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKIGGKACLIGPVY               219

VTE3.Cc       GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVY              221

VTE3.Gm       GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGAKACLIGPVY            220

VTE3.Vr       GDAEDLPFRTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVY              220

VTE3.Ac       GDAEDLPFCTDYADRYVSAGRICICNFLSIEYWPDPQRGVKEAYRVLKLGGKACLIGPVY   228

VTE3.Cm       GDAEDLPFPTDYADRYVSAGS--------IEYWPDPQRGIKEAYRVLKLGGKACLIGPVY             213

Methyltransf_2

 

VTE3.Rc2      GDAEDLPFPTDYADRYVSAGS--------IEYWPDPQRGIREAYRVLKLGGKACLIGPVY              220

Methyltransf_23

 

******** ***********         **********::******* *.********:

         
   

Ubie_methyltran

 
   
 
   
 

 

 

VTE3.Sp       PTFWLSRFFADVWMLFPKEEEYIEWFEKAGFTDVQLKKIGPKWYRGVRRHGLIMGCSVTG 277

VTE3.Ca       PTFWLSRFFADVWMLFPTEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 288

VTE3.Lc       PTFWLSRFFADVWMLFPTEEEYIEWFTKAGFKNVQLKRIGPKWYRGVRRHGLIMGCSVTG 283

VTE3.Mt       PTFWLSRFFADVWMLFPKEEEYIEWFTKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 285

VTE3.Rc1      PTFWLSRFFADVWMLFPKEEEYIEWFKRAGFKDVKLKRIGPKWYRGVRRHGLIMGCSVTG                              279

VTE3.Cc       PTFWLSRFFADVWMLFPKEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 281

VTE3.Gm       PTFWLSRFFADVWMLFPKEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG                             280

VTE3.Vr       PTFWLSRFFADVWMLFPKEEEYIDWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 280

VTE3.Ac       PTFWLSRFFADAWMLFPKEEEYIEWFKKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG 288

VTE3.Cm       PTFWLSRFFADVWMLFPKEEEYIQWFKNAGFTDVQLKRIGPKWYRGVRRHGLIMGCSVTG                             273

VTE3.Rc2      PTFWLSRFFADVWMLFPKEEEYIEWFQKAGFKDVQLKRIGPKWYRGVRRHGLIMGCSVTG                             280

***********.*****.*****:** .***.:*:**:**********************

 

VTE3.Sp       VKSTPGDSPLQLGPKAEDVTKPVNPFVFMLRFLLGATAATYYVLVPIYMWVKDQVVPEGE 337

VTE3.Ca       VKPASGDSPLQLGPKEEDVEKPIKPWVFLLRFALGTLAAAWFVLIPIYMWLKDQIVPKGQ   348

VTE3.Lc       VKPASGDSPLQLGPKEEDVEKPVDPFVFLPRFILGVLAAAWFSLVPIYMWLKDQIVPKGQ    343

VTE3.Mt       VKPASGDSPLQLGPKEEDVEKPVNPLVFLLRFALGILAASWYVLIPIYMWLKDQIVPKDQ    345

VTE3.Rc1      VKPLSGDSPLQLGPKAEDVKKPVNPFTFLLRFILGTIAATYYVLVPIYMWIKDQIVPKGM     339

VTE3.Cc       VKPASGDSPLQLGPKEEDVEKPVNPFVFLMRFLLGAIAATWYVLVPIYMWLKDQVVPEGQ 341

VTE3.Gm       VKPASGDSPLQLGPKEEDVEKSVNPFVFALRFVLGALAATWFVLVPIYMWLKDQVVPKGQ                            340

VTE3.Vr       VKPASGDSPLQLGPKEEDVEKPVNPFVFLMRFLLGALAATWFVLVPIYMWLKDQIVPKGQ 340

VTE3.Ac       VKPASGDSPLQLGPKAEDVSKPTNPFVFLMRFILGAMAATYYVLVPIYMWIKDQLVPKGM 348

VTE3.Cm       VKPSSGDSPLQLGPKEEDVSKPVNPFVFLGRFLLGAMAATYYVLVPIYMWIKDQIVPKGQ 333

VTE3.Rc2      VKPASGDSPLQLGPKEEDVSKPVNPFVFFLRFILGAMAATYYVLVPIYMWLKDQIVPKGR  340

**   ********** *** *  .* .*  ** **  **::: *:*****:***:**:.

شکل2- ت

Tocopherol_cycl

 

TC.Bn      SIPRASASISTTNSDSSPSGNAINSEAISVKPVYVPTPPNRELRTPHSGYHFDGTARKFF                      94

TC.Mt      --I-------------AHNSHTEQQQSQSSKPIYSPTPPNRQLRTPHSGYHFDGTARKFF        84

TC.Lc      --ALNSV----S---SHTDPIEDNQQSQSPKPIYSPTPPNRQLRTPHSGYHFDGTARKFF                               96

TC.Tp      --A---H----N---SHTDPIQDKQQSQSSKPIYSPTPPNRQLRTPHSGYHFDGTARKFF   92

TC.Ad      --ATP-------KARPILCTAKTQSQQPTPPPTYSPTPPNRQLRTPHSG-----SARKFF          56

TC.Vr      --AHASV----SDTVPLQNT-PQTPPSLTVKPTYSPTPPNRDLRTPHSGYHFDGTARKFF                           97

TC.Gs      --ARSFF----SDTVPIDNK-EKEQLVTSVKPTYSPTPPNRHLRTPHSGYHFDGTTRKFF                           85

TC.Cc      --VRSSV----SDTVPIDKN-QKEQ----LKPNYSPTPPNRDLRTPHSGYHFDGTARKFF                              88

TC.Mn      SQTNLRS----SAPDSVSEVRRDEEKSPSVSPVYTPTPPNRDLRTPHSGYHFDGTTRKFF                      107

TC.Pp      ----TKS----S--ISSSTTQQDKDSVSSVNPVYVPTPQNRDLRTPHSGYHFDGTNRKFF                              96

TC.Jc      ----SNS----RIFVSNSVTNPETEFLSSVSPVYAPTPPNRELRTPHSGYHFDGTTRQFF  106

Tocopherol_cycl

 

* * *** **.*******     : *:**

 
   

 

 

TC.Bn      EGWYFRVSIPEKRESFCFMYSVENPAFRKRLSPLEVGLYGPRFTGVGAQILGANDKYLCQ          154

TC.Mt      EGWYFKVSIPEKRQSFCFMYSVENPAFRKELSTLELAQYGPRFTGVGAQILGADDKYICQ           144

TC.Lc      EGWYFKVSIPEKRQSFCFMYSVENPAFRKQLTTFELAQYGPRFTGVGAQILGADDKYICQ           156

TC.Tp      EGWYFKVSIPERRQSFCFMYSVENPAFPKQLTTFELAQYGPRFTGVGAQILGADDKYICQ           152

TC.Ad      EGWYFKVSIPERRQSFCFMYSVESPSFPRKLTPFEVTQYGPRFTGVGAQILGADDKYICQ              116

TC.Vr      EGWYFRVSIPERRQSFCFMYSVESPSFRKPLTTLEQLQYGPRFTGVGAQILGADDKYICQ              157

TC.Gs      EGWYFKLSIPERRQSFCFMYSVESPSFRKPLTPLEVAQYGSRFTGVGAQILGADDKYICQ             145

TC.Cc      EGWYFKVSIPERRQSFCFMYSVESPSFRKPLTQLELAQFGSRFTGVGAQILGADDKYICQ             148

TC.Mn      EGWYFKVSIPETKQSFCFMYSVENPAFRRKLSPWEVAQHGPRFTGVGAQILGAYDKYICQ        167

TC.Pp      EGWYFKVSIPERRQSFCFMYSVENPAFRKKLTPLEVAQNGPRSTGVGAQILGAYDKYICQ          156

TC.Jc      EGWYFKVSIPERKQSFCFMYSLENPAFRKKLTPFEVAQHGPRSTGVGAQILGAYDKYICQ           166

Tocopherol_cycl

 

*****::**** ::*******:*.*:* : *:  *    * * ********** ***:**

 

TC.Bn      YTEDSHNFWGDRHELVLGNTFSAMPGARSPDKEVPPEEFNRRVSEGFQATPFWHQGHICD       214

TC.Mt      YTPQSPNFWGSRNELMLGNTFAAKQNSKPPNKEVPPKEFNDKVLEGFQVTPLWNQGFICD        204

TC.Lc      YTPESHNFWGSRNELMLGNTFAAKPNSKPPKKEVDPKDFNDRVLEGFQVTPLWHQGSICD        216

TC.Tp      YTQESNNFWGSRNELMLGNTFAAKQNSKPPNKEVPPKEFNDRVLEGFQVTPLWHQGFICD       212

TC.Ad      FSEESQNFWGDRHELILGNTFVAKNNSRPPNKELPPQEFDNKVLEGFQVTPLWHQGFIRD           176

TC.Vr      YSPESQFFWGSRHELMLGNTFVPNQNSKPPNKELPPQEFNDRVLEGFQVTPLWNQGFIQD          217

TC.Gs      FSPESQFFWGSRHELMLGNTFVPNQNSKPPNKEVPPQEFNDRVLEGFQVSPLWHQGFIRD          205

TC.Cc      YSPESQFFWGSRHELMLGNTFISKQNSKPPNKEVPPQEFNNRVVEGFQVTPLWNQGFIRD           208

TC.Mn      FSEESQNFWGSRHELSLGNTFTAEKGQTPPNKEFPPQEFNRRVVEGFQVTPLWNQGFICD          227

TC.Pp      YSEESQNFWGSRDELMLGNTFVAEKQLKPPNKEVPPKEFDRRVMEGFQVTPLWHQGSIRD       216

TC.Jc      HVEESQNFWGNRHELVLGNTFVAEKGMQPPTKEVPPQDFSRRVSEGFQVTPLWHQGFIRD        226

Tocopherol_cycl

 

.  :*  ***.*.** *****        * **. *::*. :* ****.:*:*:** * *

 
   

 

 

TC.Bn      DGRTDYAETVKSARWEYSTRPVYGWGDVGTKQKSTAGWPAAFPVFEPHWQICMAGGLSTG  274

TC.Mt      DGRSDYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG  264

TC.Lc      DGRSNYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMGGGLSTG   276

TC.Tp      DGRSNYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG   272

TC.Ad      DRRSNYVETVETARWEYSTRPVYGWGNVGSAQKSTAGWLAAFPVFEPHWQICMAGGLSTG   236

TC.Vr      DGRSDYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG   277

TC.Gs      DGRSNYVETVKTARWEYSTRPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAGGLSTG  265

TC.Cc      DGRSDYVETVKTARWEYSTLPVYGWGDVGSTQKSTAGWLAAFPVFEPHWQICMAAGLSTG   268

TC.Mn      DGRSDYVDVVKTARWEYSTRPVFGWGDVGSKQKSTAGWLAAFPVFEPHWQICMAGGLSTG 287

TC.Pp      DGRSDYVETVPTARWEYSTRPVYGWGDVGSKQKSTAGWLAAFPVFEPHWQICMAGGLSTG   276

TC.Jc      DGRSDYVQTVKTARWEYSTRPVYGWGDVGSKQKSTAGWLAAFPVFEPHWQICMAGGLSTG  286

Tocopherol_cycl

 

* *::*.:.* :******* **:***:**: ******* **************..*****

 
   

 

 

TC.Bn      --WIEWGDERFEFRDAPSYSEKNWGGGFPRKWFWVQCNVFEGAKGEIALTAAGGLRQLPG       332

TC.Mt      --WIEWDGERIEFENAPSYSEKNWGGAFPRKWFWAQCNVFEGASGEIALTAAGGLRQIPG          322

TC.Lc      --WIEWDGERIEFENAPSYSEKNWGGAFPRKWFWAQCNVFEGASGEVALTAAGGLRQIPG         334

TC.Tp      MCWIEWDGERIEFENAPSYSEKNWGGAFPRKWFWAQCNVFEGASGEIALTAAGGLRQIPG      332

TC.Ad      --WIEWDGERIEFNNAPSYSEKNWGGGFPRRWFWVQCNVFEGGSGEIALTAAGGLRQIPG          294

TC.Vr      --WIEWDGERIEFENAPSYSEKNWGAGFPRKWFWAQCNVFEGGSGEIALTAAGGLRLIPG           335

TC.Gs      S-WIEWDGKRIEFDNAPSYSEKNWGGGFPRKWFWVQCNVFEGASGEIALTAAGGLRQIPG        324

TC.Cc      --WIEWDGERIEFDNAPSYSEKNWGGAFPRKWFWVQCNVFEGASGEIALTAAGGLRQIPG          326

TC.Mn      --WIEWDGERFEFENAPSYCEKNWGGAFPRKWFWVQSNVFEGATGEVALTAAGGYRQIPG      345

TC.Pp      --WIEWGGERFEFQNAPSYSEKNWGGAFPRKWFWVQCNVFEGASGEVALTAGGGLRQLPG      334

TC.Jc      --WIEWDGERFEFKDAPSYSEKNWGAGFPRKWFWVQCNVFEGAIGEVALTAAGGLRQLPG        344

Tocopherol_cycl

 

****..:*:** :****.*****..***:***.*.*****. **:****.** * :**

 

TC.Bn      LTETFENAALVCVHYDGKLYEFVPWNGVVSWEMSPWGYWYMTAENETHM-----------                 381

TC.Mt      LTETFENAALIGIHYGGKFYEFVPWNGVVSWEVATWGYWFMSADNGNYVV----------                  372

TC.Lc      LTETFENAALIGVHFGGKFYEFVPWNGVVTWEVATWGYWFMSADNGNYV-----------                   383

TC.Tp      LTETFENAALIGVHYGGKFYEFVPWNGVVSWEVATWGYWFMTADNGNYVMFKLRNLNILL  392

TC.Ad      ITETYENAALIGVHYAGIFYEFVPWNGVVNWEVNPWGYWFMSADNGRHV-----------                    343

TC.Vr      ITETYENAALIGIHYDGKFYEFVPWNGVVNWEIATWGYWFISADNGKYV-----------                         384

TC.Gs      IAETFENAALIGIHYGGIFYEFVPWNGVVNWEVTTWGYWFMSADNGRYV-----------                       373

TC.Cc      ITETFENAALIGIHYGGKFYEFVPWNGVVNWEVATWGYWFMSADNGNYV-----------                     375

TC.Mn      LTETFENAALVGVHYGGKFYEFVPWNGVVSWEIASWGYWHLAGENNTHM-----------                  394

TC.Pp      LTETFENAALIGVHYGGKFYEFVPWYGDVSWEISPWGYWSIAAENETHK-----------                        383

TC.Jc      LTENFESAALIGVHYEGIFYEFVPWNGVLNWEISPWGYWFITAENKSHL-----------                            393

Tocopherol_cycl

 

::*.:*.***: :*: * :****** * :.**:  **** ::.:*  :

 
   

 

 

TC.Bn      ------------------------------------VELEARTNEAGTPLRAPTSEAGLA      405

TC.Mt      -------------------------------------ELEATTEDPGTTLRAPTSEAGLS         395

TC.Lc      ------------------------------------VELEATADDPGTTLRAPTSEAGLS       407

TC.Tp      MIAVGEGKQLNDLNSEHVNDCAIHTSKWDLLCATLTVELEATTDDPGTTLRAPTSEAGLS          452

TC.Ad      ------------------------------------VELEARTDDPGTTLRAPTMEAGLA    367

TC.Vr      ------------------------------------VELEATAEDPGTTLRAPTEEAGLA      408

TC.Gs      ------------------------------------VEIEATTEDPGTTLRAPTAEAGLA       397

TC.Cc      ------------------------------------VEIEATADDPGTALRAPTAEAGLS      399

TC.Mn      ------------------------------------VELEATTQHSGTTLRAPTSEAGLA     418

TC.Pp      ------------------------------------IELEATTEDSGTTLRAPTAESGLA         407

TC.Jc      ------------------------------------VELKATTKDPGTTLRAPTTESGFA        417

Tocopherol_cycl

 

*::* :.. ** ***** *:*::

 
   

 

 

TC.Bn      TACKDSCYGELKLQIWERRYDGSKGKVIMEAKSSMAAVEIGGGPWFGTWKGDTSNTPELL      465

TC.Mt      QACKDTCFGILKLKLWERRYDGSKGKIILDVTSDMAALEVGGGPWFNTWKGKTS-TPPVL         454

TC.Lc      QACKDTCFGNLKLKLWERRYDGSKGKIILDVKSDMAALEVGGGPWFNTWKGKTS-TPPVL       466

TC.Tp      QACKDTCFGILKLKLWERRYDGSKGKIILDVTSDMAALEVGGGPWFNTWKGKTS-TPPVL         511

TC.Ad      PACKDTCFGILKLQIWERRYDGSKGKLILDVSSNMAALEVGGGPWFSPWKGQTS-TPAVL          426

TC.Vr      PACKDTCFGILKLQMWERRYDGSKGKIILNVSSNMAALEVGGGPWFDTWKGKTS-TPAAL        467

TC.Gs      PACKDTCFGDLKLQMWERRYDGSKGKIILDVSSNMAALEVGGGPWFNTWKGKTS-TPAAL      456

TC.Cc      PACKDTCFGILQLKLWERRYDGSKGKIILDVSSNMAALEVGGGPWFSTWKGKTS-TPAVL          458

TC.Mn      PVCKDTCFAVLKLQIWERKFDGSKGKIILDVTSDMAAAEVGGGPWFNTWKGKTA-TPESV       477

TC.Pp      PACKDTCFGELKLQIWERRYDGSKGKLILDVKSNMAAVEVGGGPWFSTWKGKTS-TPELL        466

TC.Jc      PACKDTCFGDLKLQIWERRYDGTKGKMILDVTSDMAAVEVGGGPWFNTWKGKTT-TPELL       476

.***:*:. *:*::***::**:***:*::..*.*** *:******. ***.*: **  :

 

TC.Bn      KRSLQVPLDLESVFGWVPFFKPPGL-                         490

TC.Mt      SRAIGLPVDVDGLYNLFPLFKPPGL-                          479

TC.Lc      QRAIGLPIDVESIYNLFPLFKPPGFL                             492

TC.Tp      SRAIGLPVDVDGIYNLFPLFKPPGL-                            536

TC.Ad      KRALELPIDVDGFFNAVPLFKPPGL-                          451

TC.Vr      RSALQLPIDVDSIFNLVPLFKPPGL-                             492

TC.Gs      SRVLELPIDVEGIFNPVPLFKPPGL-                             481

TC.Cc      SRALQLPIDVEGIFNNIPLFKPPGL- 483

TC.Mn      RQALNVPVDVEGFFNLAPFFKPPGL-                       502

TC.Pp      SRALRVPVDVEGAYNLVPLFKPPGL-                       491

TC.Jc      NRALNVPVDVEGIFNFLPLFKPPGL-                           501

: :*:*::. :.  *:*****:

شکل2- ث

       
   

CMAS

 
   
 

 

 

TMT.Aa       -MASSTVGDVAVAGPVSEQQQQELRKGIAEFYDESSLMWENIWGEHMHHGYYDNDAVDVQ                            59

TMT.Sl       -----MNAVSSSSVEVGIQNQQELKKGIADLYDESSGIWEDIWGDHMHHGYYEPKS-SVE             112

TMT.Ga       --------------AVSSSSTTTLQEGIAEFYDESSGIWEDIWGDHMHHGYYDPGS-DVS                            94

TMT.Gh       --------------AASSLSTTTLQEGIAEFYDQSSGIWEDIWGDHMHHGYYDPDS-NVS                           94

TMT.Mn       RRAAAT-EAQLDDDDHSGIMWKQLQKGIAEFYDESSTLWENIWGDHMHHGFYDPDS-SVS 110

TMT.Lc       AVT-----TREQEIVLE-EEKKKLQLGIAEFYDESSGIWENIWGDHMHHGFYDPDS-TVS                99

TMT.Ts       AVK-----TSKQEIVLEEEEKKKLQLGIAEFYDESSGIWENIWGDHMHHGYYDPDS-TVS              55

TMT.Va       ----------MSAVEQHEKEKEKLQKGIAEFYDESSTIWENIWGDHMHHGFYDPDS-TVS                   49

ADH_zinc_N

 

Methyltransf_2

 

MetW

 

TMT.Gm2      --------MSVEQKAAGKEEEGKLQKGIAEFYDESSGIWENIWGDHMHHGFYDPDS-TVS            51

Methyltransf_24

 

TMT.Gm1      SAASSERGEIVLEQKPKKDDKKKLQKGIAEFYDESSGLWENIWGDHMHHGFYDSDS-TVS  100

FtsJ

 

Methyltransf_9

 

TMT.Gs       -------------MAGKEEKEGKLQKGIAEFYDESSGLWENIWGDHMHHGFYDPDS-TVS                     46

MTS

 

Methyltransf_32

 

*: ***::**:** :**:***:*****:*:  :  *.

       
   
     
 

 

 

 

 

Methyltransf_23

 

Methyltransf_25

 

TMT.Aa       LSDHRSAQIRMVEQALAFANL-QDDPEKKPKSIVDVGCGIGGSSRYLAKKYGAECCGITL       118

TMT.Sl       LSDHRAAQIRMIEQALSFAAI--SDPAKKPTSIVDVGCGIGGSSRYLAKKYGATAKGITL             170

TMT.Ga       GSDHRAAQIRMIEESLRFAGI-SDDPANRPKRIVDVGCGIGGSSRYLARKYGAKCQGITL         153

TMT.Gh       GSDHPAAQIRMIEESLRFAGI-TEDPANKPKTIVDVGCGIGGSSRYLARKYGAKCQGITL          153

TMT.Mn       LSDHRPAQIRMIDEALRFASLPE-----EPKNVVDVGCGIGGSSRYIASKYGAKCKGITL               165

TMT.Lc       VSDHRQAQIRMIEQSLDFASLSSEDSTKWPKSVVDVGCGIGGSSRYLAKKFGASCVGITL       159

TMT.Ts       VSDHRAAQI--------------QDPTKWPKTVVDVGCGIGGSSRYLAKKFGASCVGITL                          101

TMT.Va       VSDHRAAQIRMIEESLRFASL-SEEPTKWPKRIVDVGCGIGGSSRYLAEKFGATSVGITL           108

Methyltransf_2

 

TMT.Gm2      VSDHRAAQIRMIQESLRFASLLSENPSKWPKSIVDVGCGIGGSSRYLAKKFGATSVGITL       111

ADH_zinc_N

 

MetW

 

TMT.Gm1      LSDHRAAQIRMIQESLRFASV-SEERSKWPKSIVDVGCGIGGSSRYLAKKFGATSVGITL        159

Methyltransf_24

 

Methyltransf_9

 

TMT.Gs       LSDHRLAQIRMIQESLRFASV-SEERSKWPKSIVDVGCGIGGSSRYLAKKFGATSVGITL           105

FtsJ

 

***  ***                    *. :*************:* *:** . ****

       
   
     
 

 

 

 

 

Methyltransf_31

 

TMT.Aa       SPVQAERAQALADAQGLGDKVSFQVADALNQPFPDGKFDLVWSMESGEHMPDKLKFVSEL                             178

Methyltransf_23

 

Methyltransf_25

 

TMT.Sl       SPVQAERAQALADAQGLGDKVSFQVADALNQPFPDGQFDLVWSMESGEHMPNKEKFVGEL 230

TMT.Ga       SPVQAGRANALANAQVLADQVCFEVADALNQPFPDDQFDLVWSMESGEHMPDKPKFVEEL                            213

TMT.Gh       SPVQAGRANALAKDQGLADKVSFQVADALNQPFPDDQFDLVWSMESGEHMPDKPKFVKEL                            213

TMT.Mn       SPVQAQRANALASSQSLSPQVSFQVADALDQPFADGKFDLVWSMESGEHMPDKSKFVSEL 225

TMT.Lc       SPVQAERANALAAAQGLADKVSFQVADALEQPFPDGQFDLVWSMESGEHMPNKPKFVGEL 219

TMT.Ts       SPVQAERANALAASQGLADKVSFQVADALEQPFPDGQFDLVWSMESGEHMPNKAKFVGEL 161

TMT.Va       SPVQAQRANALAAAQGLAHKVSFQVADALQQPFPDGQFDLVWSMESGEHMPDKTKFVGEL                            168

Methyltransf_2

 

TMT.Gm2      SPVQAQRANSLAAAQGLADKVSFEVADALKQPFPDGKFDLVWSMESGEHMPDKAKFVGEL                          171

ADH_zinc_N

 

MetW

 

TMT.Gm1      SPVQAQRANALAAAQGLADKVSFQVADALQQPFSDGQFDLVWSMESGEHMPDKAKFVGEL                         219

Methyltransf_24

 

TMT.Gs       SPVQAQRANALAAAQGLDDKVSFEVADALKQPFPDGKFDLVWSMESGEHMPDKAKFVGEL                            165

Methyltransf_9

 

***** **::**  * *  :*.*:*****.*** *.:**************:* *** **

         
     
   
 
   
 

 

 

 

Methyltransf_31

 

TMT.Aa       VRVAAPGATIIIVTWCHRDLSPDEKSLRPEEQKILDKICSSFYLPAWCSTADYVKLLESL          238

Methyltransf_25

 

TMT.Sl       ARVAAPGGTIILVTWCHRDLSPSEESLTPEEKELLNKICKAFYLPAWCSTADYVKLLQSN        290

TMT.Ga       VRVAAPGGTIIVVTWCHRDLGPSEESLQPWEQKLLNRICDAYYLPEWCSTSDYVKLFQSL    273

TMT.Gh       ARVAAPGGTIIIVTWCHRDLGPSEEDLQPWEKKLLNRICNAYYLPEWCSTSDYVKLLQSL     273

TMT.Mn       ARVAAPGGTIIIVTWCHRDLKPGEESLQPWEQTLLNKICDAFYLPAWCSTADYVRLMESL   285

TMT.Lc       VRVAAPGGTIIIVTWCHRDLRPDEESLQPWEENLLKKICDSFYLPAWCSTAEYVKLLETM      279

TMT.Ts       ARVAAPGGTIIIVTWCHRDLRPDEESLQPWEEKLLKKICDSFYLPAWCSTAEYVKLLETM       221

TMT.Va       ARVAAPGGTIIIVTWCHRDLGPDEQSLKPWEQDLLKKICDAFYLPAWCSAADYIKLLKSL     228

TMT.Gm2      ARVAAPGGTIIIVTWCHRDLGPDEQSLLPWEQDLLKKICDSYYLPAWCSTSDYVKLLESL   231

TMT.Gm1      ARVAAPGATIIIVTWCHRDLGPDEQSLHPWEQDLLKKICDAYYLPAWCSTSDYVKLLQSL 279

TMT.Gs       ARVAAPGATIIIVTWCHRELGPDEQSLHPWEQDLLKKICDAYYLPAWCSASDYVKLLQSL    225

.******.***:******:* *.*:.* * *: :*.:**.::*** ***:::*::*:::

 

TMT.Aa       SLQDIKSADWSGNVAPFWPAVIKTALSWKGITSLLRSGWKTIRGAMVMPLMIEGFKKDII      298

TMT.Sl       SLQDIKAEDWSENVAPFWPAVIKSALTWKGFTSVLRSGWKTIKAALAMPLMIEGYKKGLI     350

TMT.Ga       SLQDIKAGDWTENVAPFWPAVIRSALTWKGFTSLLRSGLKTIKGALVMPLMIEGFQKGVI    333

TMT.Gh       SLQDIKAADWTENVAPFWPAVIRSALTWKGFTSLLRSGLKTIKGALVMPLMIQGYQKGVI   333

TMT.Mn       SLQDIKAADWSQYVAPFWPAVIRSALTWKGLTSLLRAGRKTIRGALAMPLMIEGYKKDLI  345

TMT.Lc       SLQDIKSADWSPFVAPFWPAVIRSALTWKGFTSILRSGLKTIKGALAMPLMIEGFRKGVI          339

TMT.Ts       SLQDIKSADWSPFVAPFWPAVIRSALTWKGFTSILRSGLKTIKGAFAMPLMIEGFRKGVI           281

TMT.Va       SLQDIKSADWSPFVAPFWPAVIRSALTWNGLTSLLRSGVKTIKGALAMPLMIKGYKKGLI     288

TMT.Gm2      SLQDIKSADWSPFVAPFWPAVIRTALTWNGLTSLLRSGLKTIKGALAMPLMIKGYKKDLI   291

TMT.Gm1      SLQDIKSEDWSRFVAPFWPAVIRSAFTWKGLTSLLSSGQKTIKGALAMPLMIEGYKKDLI    339

TMT.Gs       SLQDIKSEDWSRFVAPFWPAVIRSALTWNGLTSLLRSGLKAIKGALAMPLMIKGYKKNLI     285

******: **:  *********::*::*:*:**:* :* *:*:.*:.*****:*::*.:*

 

TMT.Aa       KFSIITCRKPE-----                               309

TMT.Sl       KFAIITCRKPE-----                               361

TMT.Ga       KFAIIACRKPAE----                          345

TMT.Gh       KFAIITCRKPE-----                             344

TMT.Mn       KFAIITCRKPHQ----                          357

TMT.Lc       KFAIITCRKPEN----                            351

TMT.Ts       KFSIITCRKPENQEGQ                      297

TMT.Va       KFVIITCRKPE-----                              299

TMT.Gm2      KFSIITCRKPE-----                            302

TMT.Gm1      KFAIITCRKPE-----                           350

TMT.Gs       KFAIITCRKPE-----                              296

** **:****

شکل2- ج

شکل 2- هم‌ردیفی چندگانه توالی پروتئین‌های HPPD (الف)، VTE5 (ب)، HPT (پ)، VTE3 (ت)، TC (ث) و γ-TMT (ج) در عدس با ده پروتئین مشابه دیگر توسط برنامه Clustal Omega. ستاره‌ها معرف اسیدآمینه‌های حفاظت‌شده در بین تمام پروتئین‌های گیاهی هستند و شکاف‌ها نشان‌دهنده‌ هم‌ردیفی بهینه بین تمام توالی‌های مقایسه شده می‌باشد. با استفاده از نرم‌افزار InterProScan محدوده اسیدآمینه دمین‌ها‌، زیردمین‌ها و خانواده‌های پروتئینی به‌ترتیب توسط مثلث‌های قرمز و آبی، سبز و سیاه و موتیف‌ها توسط خطوط رنگی با استفاده از ابزار MOTIF Search مشخص شده‌اند.

Figure 2. Multiple sequence alignment of HPPD (a), VTE5 (b), HPT (c), VTE3 (d), TC (e) and γ-TMT (f) in lentil with ten similar proteins by Clustal Omega program. The asterisks indicate the residues conserved among all the aligned plant proteins. Gaps demonstrate optimal alignment among all compared sequences. Using the InterProScan software, the amino acid range of domains, subdomains and protein families are shown respectively by the red, blue, green and black triangles. Motifs are marked by color lines using the MOTIF Search tool.

 

 

نتایج بررسی هومولوژی بین پروتئین‌های شناسایی شده و ده پروتئین مشابه آن‌ها بعد از هم‌ردیفی با برنامه Clustal Omega و با E-value کمتر از یک نشان داد که پروتئین‌های پیش‌بینی شده HPPD، VTE5، HPT، VTE3، TC و γ-TMT در گیاه عدس، به‌ترتیب هومولوژی 100، 99، 100، 80، 82 و 100 درصدی با همین پروتئین‌ها در گیاهان نخود، نخود، یونجه، یونجه، شبدر، شبدر دارند (شکل 3).

جهت پیش‌بینی حضور دمین­های عملکردی پروتئین‌های مورد نظر و خانواده‌های پروتئینی آن‌ها نیز از برنامه InterProScan استفاده شد. برای پروتئین HPPD مشخص شد از اسیدآمینه نه تا 433 متعلق به بالاخانواده Glyoxalase/Bleomycin resistance protein/Dihydroxybiphenyl dioxygenase است و دو دمین Vicinal oxygen chelate (VOC) در محدوده اسیدآمینه 137-33 و 374-214 و یک زیردمینGlyoxalase/fosfomycinresistance/dioxygenase از اسیدآمینه 214 تا 368 مشخص شد (شکل 2- الف). پروتئین VTE3 در محدوده اسیدآمینه 267-76 متعلق به بالاخانواده S-adenosyl-L-methionine-dependent methyltransferase می‌باشد و دارای یک دمین از اسیدآمینه 73 تا 282 با دو عملکرد Methyltransferase type 11 وSAM-binding methyltransferase MPBQ/MBSQ است (شکل 2- ت). دامنه اسیدآمینه 350-68 در پروتئین γ-TMT همانند پروتئین VTE3 مربوط به بالاخانواده S-adenosyl-L-methionine-dependent methyltransferase می‌باشد و این پروتئین دارای یک دمین حفاظت‌شده Methyltransferase type 11 از اسیدآمینه 133 تا 231 است (شکل 2- ج). همچنین برنامه MOTIF Search نشان داد که پروتئین‌های HPPD، HPT، VTE3، TC و ᵧ-TMT به ترتیب سه، یک، یک، 12 و 15 موتیف حفاظت‌شده دارند که در جدول2 گفته شده است و عملکرد مولکولی پروتئین‌های پیش‌بینی‌شده و فرایندهای زیستی که پروتئین‌ها در ان‌ها دخیل‌اند برنامه­ی InterProScan در جدول 3 خلاصه شده است.

 

 

جدول3- تعیین عملکرد مولکولی و فرایند های زیستی با برنامه InterProScan

Table 3. Determination of the molecular function and biological process of proteins with InterProScan program

Protein

Biological Process

Molecular Function

 

HPPD

 

- Aromatic amino acid family metabolic process

- Oxidation-reduction process

 

-4-hydroxyphenylpyruvate dioxygenase activity

- Oxidoreductase activity, acting on single donors with incorporation of molecular oxygen

VTE5

None predicted.

None predicted.

HPT

None predicted.

Transferase activity, transferring alkyl or aryl (other than methyl) groups

VTE3

Methylation

Methyltransferase activity

TC

None predicted.

Tocopherol cyclase activity

γ-TMT

Methylation

Methyltransferase activity

 

 

ترکیب اسیدهای آمینه در ساختار اولیه پروتئین‌ها نشان داد که بالاترین فراوانی متعلق به لوسین، سرین، گلایسین و کمترین فراوانی متعلق به دو اسیدآمینه سلنوسیستئین و پیرولیزین است. شاخص ناپایداری بالای 40 نشان می‌دهد که پروتئین عمر بالایی ندارد. این موضوع حاکی از آن است که به این پروتئین فقط در زمان خاصی در سلول نیاز است و اگر شاخص ناپایداری پایین‌تر از 40 باشد، پروتئین پایدارتر است و به‌صورت دائم مورداستفاده قرار می‌گیرد (جدول 4).

 

 

جدول 4- تعیین خصوصیات ساختار اولیه پروتئین‌ها با ابزار ProtParam

Table 4. Characterization of primary structure of proteins with the ProtParam tool

GRAVY

II

number of charged residues

aa composition (%)

pI

Mw

(KDa)

Protein

positively

negatively

Min

max

-0.363

0.380

0.467

-0.242

-0.463

-0.148

41.54

41.32

44.66

39.59

36.58

56.82

45

29

29

45

48

37

58

20

23

37

51

40

Pyl & Sec (0)

Pyl & Sec (0)

Pyl & Sec (0)

Pyl & Sec (0)

Pyl & Sec (0)

Pyl & Sec (0)

Ser (9)

Leu (11.7)

Leu (11.6)

Leu (8.4)

Gly (9.1)

Ser (10)

5.31

9.66

8.83

9.09

6.34

6.27

48.11943

34.47431

40.06685

38.70770

55.24714

39.04769

HPPD

VTE5

HPT

VTE3

TC

γ-TMT

 

 

پیش‌بینی نتایج حاصل از مکانیزم محل قرارگیری پروتئین‌ها در سلول‌های یوکاریوتی برنامه آنلاین DeepLoc-1.0 نشان داد که به غیر از پروتئین HPPD که به‌صورت محلول در سیتوپلاسم است، پنج پروتئین دیگر در فضای بین دو غشا پلاستیدها قرار می‌گیرند (جدول5).

 

 

جدول 5- تعیین محل استقرار پروتئین‌ها در سلول با برنامه DeepLoc-1.0

Table 5. Determination of proteins subcellular localization with DeepLoc-1.0 program

Protein

Localization

Type

HPPD

VTE5

HPT

VTE3

TC

γ-TMT

Cytoplasm

Plastid

plastid

Plastid

Plastid

Plastid

Soluble

Membrane

Membrane (integral component of membrane)

Membrane

Membrane

Membrane

 

 

 

 

 

 



 
   

 

 
   


شکل 3-الف

 

شکل 3- ب

 
   


شکل 3- پ

شکل 3- ت

 
   

 

 

 
   


شکل 3- ث

 
   


شکل 3- ج

شکل 3- آنالیز فیلوژنتیکی پروتئین‌های HPPD (الف)، VTE5 (ب)، HPT (پ)، VTE3 (ت)، TC (ث) و γ-TMT (ج) در عدس که توسط نرم افزار MEGA 7 با مربع‌های قرمز مشخص شده‌است.

Figure 3. Phylogenetic analysis of HPPD (a), VTE5 (b), HPT (c), VTE3 (d), TC (e) and γ-TMT (f) in lentil, by the MEGA 7 software with red squares is shown.

 

 

REFERENCES

Arango, Y. & Heise, K. P. (1998). Localization of α-tocopherol synthesis in chromoplast envelope membranes of Capsicum annuum L. fruits. Journal of Experimental Botany, 49(324), 1259-1262.

Bao, R., Huang, L., Andrade, J., Tan, W., Kibbe, W. A., Jiang, H., & Feng, G. (2014). Review of current methods, applications, and data management for the bioinformatics analysis of whole exome sequencing. Cancer Informatics, 13, CIN-S13779.

Bramley, P. M., Elmadfa, I., Kafatos, A., Kelly, F. J., Manios, Y., Roxborough, H. E., Schuch, W., Sheehy, P. J. & Wagner, K. H. (2000). Vitamin E: A critical review. Journal of the Science of Food Agriculture, 80, 913-938.

Fryer, M. J. (1993). Evidence for the photoprotective effects of vitamin E. Photochemistry and Photobiology, 58(2), 304-312.

Gill, R. W. & Sanseau, P. (2000). Rapid in silico cloning of genes using expressed sequence tags (ESTs). Biotechnology Annual Review, 5, 25-44.

Hugly, S. & Somerville, C. (1992). A role for membrane lipid polyunsaturation in chloroplast biogenesis at low temperature. Plant Physiology, 99(1), 197-202.

Kumar, S., Stecher, G. & Tamura, K. (2016). MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets. Molecular Biology and Evolution, 33(7), 1870-1874.

Mène-Saffrané, L. & DellaPenna, D. (2010). Biosynthesis, regulation and functions of tocochromanols in plants. Plant Physiology and Biochemistry, 48(5), 301-309.

Mene-Saffrane, L. & Pellaud, S. (2017). Current strategies for vitamin E biofortification of crops. Current Opinion in Biotechnology, 44, 189-197.

Muehlbauer, F. J., Cho, S., Sarker, A., McPhee, K. E., Coyne, C. J., Rajesh, P. N. & Ford, R. (2006). Application of biotechnology in breeding lentil for resistance to biotic and abiotic stress. Euphytica, 147(1-2), 149-165.

Ruiz‐Sola, M. Á., Coman, D., Beck, G., Barja, M. V., Colinas, M., Graf, A. & Gruissem, W. (2016). Arabidopsis Geranylgeranyl Diphosphate Synthase 11 is a hub isozyme required for the production of most photosynthesis‐related isoprenoids. New Phytologist, 209(1), 252-264.

Spitzer, V. & Schweigert, F. (2007). Vitamin basics. The facts about vitamins in nutrition. DSM Nutritional Products Ltd, Germany.

Srivastava, R. P. & Vasishtha, H. (2012). Saponins and lectins of Indian chickpeas (Cicer arietinum) and lentils (Lens culinaris). Indian Journal of Agricultural Biochemistry, 25(1), 44-47.

Valentin, H. E., Lincoln, K., Moshiri, F., Jensen, P. K., Qi, Q., Venkatesh, T. V.,  Karunanandaa, B.Baszis, S. R.Norris, S. R.Savidge, B.Gruys, K. J.Last, R. L. (2006). The Arabidopsis vitamin E pathway gene5-1 mutant reveals a critical role for phytol kinase in seed tocopherol biosynthesis. The Plant Cell, 18(1), 212-224.

Vom Dorp, K., Hölzl, G., Plohmann, C., Eisenhut, M., Abraham, M., Weber, A. P. M., Hanson, A. D. & Dörmann, P. (2015). Remobilization of phytol from chlorophyll degradation is essential for tocopherol synthesis and growth of Arabidopsis. The Plant Cell, 27(10), 2846-2859.

Yadav, S. S., McNeil, D. & Stevenson, P. C. (Eds.). (2007). Lentil: An ancient crop for modern times. Springer Science & Business Media.

 

[1] p-hydroxyphenylpyruvate dioxygenase

[2] Geranylgeranyl pyrophosphate

[3] Geranylgeranyl pyrophosphate synthase

[4] Methyl erythritol phosphate

[5] Phytyl pyrophosphate

[6] Geranylgeranyl reductase

[7] Phytol kinase

[8] Phytyl phosphate kinase

[9] Homogentisate phytyltransferase

[10] Methyltransferase

[11] Tocopherol cyclase

[12] γ-tocopherol methyl transferase

[13] Express Sequence Tag; EST

[14] National Center for Biotechnology Information

[15] Sequence Read Archive

[16] Reads

[17] Isoelectric point; pI

[18] Molecular Weight; Mw

[19] Grand average of hydropathicity; GRAVY

[20] Instability index

[21] protein subcellular localization