مقدمه
ثبت یک ژن در پایگاه های اطلاعاتی جهانی،یکی از اولین قدمهای مورد نیاز هر دانشجو و استاد دانشگاهی و پژوهشگاهی در ایران عزیزمان است. برای این مبحث، می بایست نگاهی دقیق به بانک های ژنومی بین المللی داشت. در این سری از مقالات مرکز آموزش بیوانفورماتیک نصر،بر آن هستیم تا شما را با مراحل ثبت ژن در این پایگاه ها آشنا بسازیم.
گام اول: لزوم ثبت یک ژن در دیتابیس های بین المللی
– ممکن است ما یک ژن جدید کشف کرده باشیم! بعنوان مثال با تحقیق در مورد ایزوله های مقاوم به داروی گلوکانتیم انواعی از لیشمانیا، قطعه ای را در DNA کینتوپلاستی انگل می یابیم که سکانس آن در ایزوله های مقاوم به دارو با ایزوله های حساس متفاوت است. نهایتاً ممکن است این قطعه بعنوان ژن مقاوم به داروی انگل به اثبات رسیده و ثبت گردد.
2- زمانی بود که برای چاپ یک مقاله در زمینه های تشخیصی، PCR ساده ای انجام میدادید و با گذاشتن باندهای بدست آمده در کنار مارکر حکم قطعی صادر میشد که بله، این خودش است. اما امروزه این نوع نتیجه گیری خیلی خریدار ندارد. پس بهتر است جهت تایید نتایج خود، قطعه ساخته شده را تعیین توالی هم بنمایید. ثبت این قطعات در بانک های ژنی معتبر، ارزش کار شما را افزایش خواهد داد.
3- راه اصلی تعیین هویت برخی ارگانیسم ها تعیین توالی ژنومی آنها است. بعنوان مثال فرض کنید که از یک حلزون آبزی تعدادی سرکر ترماتود جداسازی کرده ایم. تشخیص گونه یک ترماتود بر اساس مورفولوژی سرکرهای آن عملاً امکان ندارد. بعلت تنوع گونه ای این سرکرها استفاده از روشهای PCR اختصاصی برای هر گونه از انگل هم عملی نیست. در این موارد ما معمولاً از تعیین توالی قطعات ژنومی استفاده می کنیم که مارکرهای مناسبی برای جداسازی گونه های مختلف باشند، یعنی اختلافات سکانس آنها در حدی باشد که بتواند گونه های مختلف را از هم متمایز کند. طبیعی است که به اشتراک گذاشتن این اطلاعات در بانک ژنی تحقیقات بعدی را تسهیل خواهد کرد.
4- جهت مشخص سازی تاکسونومی مولکولی موجودات در یک منطقه خاص جغرافیایی معمولاً از تعیین توالی ژنومی و ثبت و مقایسه اطلاعات ژنومی آنها با یکدیگر و گونه های مشابه در سایر نقاط جغرافیایی استفاده می شود.
5- در مورد انگلها، باکتریها و سایر پاتوژنهایی که برای اولین بار از یک میزبان جداسازی می شوند معمولاً لازم است که جهت تایید، سکانس قطعه ای از ژنوم آنها در بانک ژنی ثبت گردد.
6- همینطور در مورد تمام جاندارانی که برای اولین بار در یک منطقه خاص جغرافیایی مشاهده می شوند، علاوه بر بررسیهای مورفولوژیک بهتر است آنها را از نظر ژنومی هم مورد مطالعه قرار داده و اطلاعات را در بانک ژنی ثبت نمود.
7- تحقیقات اپیدمیولوژی مولکولی. می خواهیم ببینیم که کانون جدیدی از یک بیماری عفونی که در منطقه ای پدید آمده از کدام نقطه دیگر منشاء گرفته و چه شباهت و تفاوتهایی با نقاط مجاور دارد.
8- مطالعات فیلوژنتیک. جهت بررسی ارتباطات بین گونه ها و سویه های مختلف یک جاندار. در اینحالت معمولاً از رسم درخت فیلوژنتیک آن جاندار نسبت به گونه های نزدیک به آن استفاده می شود.
9- کاربرد خیلی مهمی که اطلاعات ژنومی موجودات پیدا کرده، بررسی ارتباط بین صفات فنوتایپیک موجودات با ساختار ژنتیکی آنها است. از جمله ارتباط با پاتوژنز،مورفولوژی، مراحل چرخه زندگی، مقاومت دارویی و..
علاوه بر اینها، امروزه مطالعات بر روی ساختار ژنوم موجودات کاربردهای تخصصی متعدد در علوم ژنتیک، ایمونولوژی، فارماکولوژی و… پیدا کرده که بحث در این مورد در حیطه متخصصان آن علوم است.
گام دوم: انتخاب قطعه مناسب جهت تعیین توالی
اول از همه ببینیم کدام قطعات ژنومی برای ثبت در یک بانک ژنی مناسبترند:
الف- بین گونه ها و یا سویه های مختلف تفاوت بارزی داشته باشند. باید در نظر داشت که همواره امکان دارد حین sequencing ، مشکلات مختلفی پیش بیاید که تا حدی نتیجه کار را تحت تاثیر قرار داده و نتیجه غلط بدست بدهند. بر این اساس، استفاده از قطعات ژنومی که بین دو گونه مختلف یکی دو اختلاف بیشتر ندارند منطقی به نظر نمی رسد.
ب- با توجه به هدف، اگر منظور تعیین گونه یا سویه است از قطعاتی استفاده شود که سکانس درون گونه ای یا درون سویه ای آن پایدارتر باشد. اما اگر منظور تعیین اختلافات ژنومی در یک گستره جغرافیایی و منشاء یابی ایزوله ها است می توان از قطعاتی استفاده کرد که حداکثر تنوع ژنومی را از خود نشان می دهند.
پ- بطور کلی هر چقدر که سکانس مورد نظر جهت تعیین توالی طولانی تر باشد ارزش بیشتری جهت ثبت در بانک ژنی خواهد داشت. اما این نکته را هم نباید از نظر دور داشت که هم سنتز قطعات طویل تر توسط PCR مشکلتر است و هم اینکه تعیین توالی آنها با اشکالات بیشتری مواجه خواهد شد. در مورد قطعاتی که طول آنها بیش از 1000 جفت باز باشد، جهت تعیین توالی با دستگاههای معمول sequencer لازم است که از شکستن قطعه و کلون کردن آن در وکتور مناسب استفاده کرد (shotgun sequencing) که امکانات و هزینه بمراتب بیشتری نیاز دارد. در عین حال تعداد کمی از شرکت ها در سطح کشور تعیین توالی قطعات بیشتز از 1000 جفت باز را پوشش می دهند. لذا می توان اندازه متوسطی برای قطعه ژنومی در نظر گرفت. بنا به تجربه نگارنده، اندازه بین 400 تا 600 جفت باز مطلوب خواهد بود.
ت- معمولاً هدف ما مقایسه توالی بدست آمده با اطلاعات قبلی موجود در بانک ژنی است. چه جهت تعیین گونه و سویه، و نیز برای تاکسونومی و حتی برای تعیین جهش های صورت گرفته در یک بیماری ژنتیکی و یا بروز مقاومت دارویی. پس منطقی است که به دنبال قطعاتی باشیم که اطلاعات بیشتری از آنها در بانک ژنی موجود باشد. کار کردن بر روی قطعاتی از ژنوم یک جاندار که اطلاعات آن قطعه در بانک ژنی وجود نداشته باشد تنها هنگامی ارزش دارد که آن جاندار را قبلاً توسط روشهای مورفولوژیک یا مولکولی تشخیص داده باشیم.
ث- امکان دارد که پرایمرهایی که جهت PCR قطعه ای از DNA استفاده می شوند برای تعیین توالی آن مناسب نباشند. در تحقیقات انجام شده به کرات مشاهده می کنیم که محققین جهت sequencing یک قطعه DNA از پرایمرهای متفاوت با پرایمر PCR استفاده کرده اند. لذا در صورتیکه هدف شما از PCR یک قطعه نهایتاً sequencing آن است، از پرایمرهایی استفاده کنید که قبلاً جهت sequencing هم جوابگو بوده اند و یا آنکه برای آن قطعه سنتز شده، پرایمرهای مناسبی جهت sequencing وجود داشته باشد.
ج- اگر می خواهید برای اولین مرتبه sequencing و ثبت ژن را انجام دهید، از پرایمرهایی که قبلاً توسط دیگران طراحی شده و امتحان خود را پس داده اند استفاده کنید. طراحی پرایمر و امتحان آنها را بگذارید برای بعد.
به این نکته هم توجه داشته باشید که بعضی از پرایمرهایی که موارد استفاده متعدد در PCR و sequencing دارند ممکن است چندان هم اختصاصی نباشند. بعنوان مثال تعدادی از پرایمرهایی که جهت سنتز بخشهایی از قطعه ITS (Internal transcribed spacer) ریبوزومی جانوران طراحی شده اند ممکن است با DNA رده های دیگر جانوری هم واکنش داده و باندهای غیر اختصاصی ایجاد کنند. در چنین مواردی جهت sequencing لازم است که DNA خالص جاندار مورد نظر را داشته باشید.
بالاخره اینکه برخی از قطعات ژنومی کاربرد بیشتری جهت تعیین گونه و تاکسونومی مولکولی انواع جانداران دارند. بعنوان مثال سکانس قطعه COX1 یا همان CO1، زیر واحد 1 ژن سازنده آنزیم سیتوکروم اکسیداز سی امروزه بعنوان یک بارکد ژنتیکی (genetic barcode) جهت تاکسونومی انواع جانوران و قارچها مطرح است.
گام سوم: آشنایی با بانکهای ژنی بین المللی
بانکهای ژنی اطلاعات متنوع ژنتیکی انواع مختلف جانداران را ثبت کرده و محفوظ میدارند. اطلاعاتی که کاربردهای بسیاری در علوم پزشکی، کشاورزی، صنایع غذایی و …. یافته است. هم اکنون بانک های ژنی متعددی موجودند که اطلاعات خود را در سطح اینترنت به اشتراک می گذارند، اما جامع ترین و پرکاربرد ترین آنها سه تا هستند که عبارتند از:
1. NCBI GenBank که معمولاً از آن بعنوان GenBank هم نام برده می شود. این بانک ژنی که توسط مرکز ملی اطلاعات بیوتکنولوژی آمریکا(National Center for Biotechnology Information) ایجاد شده از سال 1992 اطلاعات خود را در دسترس عموم قرار داده است. موتور جستجوی PubMed هم در واقع از امکانات به اشتراک گزارده شده همین مرکز است. برای دسترسی به این بانک ژنی از همان آدرسی که جهت دسترسی به PubMed اسفاده می کنید، وارد شوید: http://www.ncbi.nlm.nih.gov منتهی در تولبار سمت چپ بالای صفحه، بجای PubMed واژه Nucleotide را انتخاب نمائید.
2. EMBL-EBI یا بخش بیوانفورماتیک لابراتوار بیولوژی مولکولی اروپا که مرکز آن در کشور انگلستان است. جهت جستجوی یک توالی نوکلئوتیدی در آن می بایست به بخش ENA یعنی آرشیو نوکلئوتیدی اروپا بروید، با آدرس:
3. DDBJ یا بانک DNA ژاپن که مرکز آن در انستیتوی ملی ژنتیک شیزوکای ژاپن قرار دارد.
باید توجه داشت که هر سه این منابع، اطلاعات خود را بصورت روزانه با یکدیگر به اشتراک می گذارند. بنابراین فرق چندانی ندارد که جهت جستجو و یا ثبت توالی نوکلئوتیدی از کدامیک استفاده کنید.
در ذیل آدرس اینترنتی جهت ثبت توالی در هر یک از این بانکها آورده شده است:
1. Submit sequence data to NCBI:
http://www.ncbi.nlm.nih.gov/WebSub/?tool=genbank
2. Submit sequence data to embl:
https://www.ebi.ac.uk/ena/about/submit_and_update
3. DDBJ Nucleotide Sequence Submission System:
http://www.ddbj.nig.ac.jp/sub/websub-e.html
از آنجا که استفاده از NCBI GenBankبرای ثبت توالی ژنومی از همه معمولتر است، در مورد آن بیشتر توضیح داده می شود؛
جهت ثبت یک توالی نوکلئوتیدی، توالی گروهی از نوکلئوتیدها در ژنهای مختلف و یا توالی گروهی از نوکلئوتیدها در یک ژن مشترک (مثلاً در مورد مطالعات جمعیتی) در NCBI، از سایت BankIt و یا نرم افزار Sequin استفاده می شود. Sequin نرم افزار مستقلی است که توسط شرکت NCBI طراحی شده و قادر است برای ثبت توالی های تا 10000 جفت باز نظیر ژنوم کامل میتوکندری، پلاسمید، فاژها یا برخی ویروس ها نیز به کار رود. جهت ثبت توالی های بزرگتر از نرم افزار Tbl2asn استفاده می شود. استفاده از Sequin برای کسانی مناسب است که می خواهند بصورت off-line بر روی توالی های خود کار کنند یا آنکه از امکانات دیگری نظیر alignment editor یا نمایشگر گرافیکی استفاده نمایند.
NCBI امکان دیگری هم دارد با عنوان Barcode of Life sequences که از آن برای ثبت توالی هایی استفاده می شود که بعنوان استانداردی جهت تعیین گونه و تاکسونومی انواعی از جانداران پذیرفته شده اند. در حال حاضر این بارکد تنها برای توالی حدود 5500 جفت بازی زیر واحد 1 ژن میتوکندریایی سایتوکروم اکسیداز (CO1) جانوران پذیرفته شده و استفاده می شود.
در عین حال، معمولترین راه ثبت توالی نوکلئوتیدی استفاده از همان سایت BankIt است که برای استفاده از امکانات آن، می بایست در ابتدا در آن عضو شوید (که رایگان است). در قسمتهای بعدی این نوشتار، مراحل ثبت ژن در BankIt بطور مفصل شرح داده خواهند شد.
گام چهارم: تکثیر قطعه مورد نظر و آماده سازی جهت خوانش توالی
حال فرض کنید که بالاخره تصمیم خود را گرفتیم، قطعه ژنومی و پرایمر مناسب را انتخاب کردیم و پس از انجام PCR می خواهیم محصول را جهت DNA sequencing ارسال نمائیم. منتهی قبل از این کار، باید بدانیم که محصول PCR جهت ایجاد نتیجه مناسب در sequencing باید ویژگیهایی داشته باشد:
نخست آنکه بایستی باندهایی کاملاً شارپ و قوی داشته باشیم، فاقد باند اضافه، اسمیر و همچنین پرایمر دایمر. چرا که دستگاه مورد استفاده جهت sequencing قادر به تشخیص رشته DNA مورد نظر ما در مخلوطی از رشته های مختلف نیست و بایستی الزاماً DNA هدف بصورت کاملاً خالص استفاده شود. اما اگر پس از الکتروفورزیس محصول PCR، باند اضافه، اسمیر یا پرایمر دایمر داشتیم چکار می توانیم بکنیم؟
در این حال جهت تصحیح 2 راه متفاوت وجود دارد:
1. PCR را تکرار نموده و آنقدر ترکیب مواد بکار رفته و یا مراحل PCR را تغییر دهیم تا باند اضافی و اسمیر حذف شود. این کار شاید وقت گیرتر باشد اما معمولاً نتیجه بهتری به دست می دهد. گاه حتی حین کار به این نتیجه می رسیم که پرایمر مورد استفاده اصلاً مناسب نیست و بهتر است از پرایمرهایی استفاده کنیم که باندهایی شارپ تر تکثیر می کنند.
2. راه دوم استفاده از کیت های خالص سازی DNA ژنومی است. این کیت ها خود به دو دسته تقسیم می شوند؛
الف. کیت هایی که به آنها کیت خالص سازی محصول PCR گفته می شود. این کیت ها به محصول PCR ایجاد شده در تیوبها افزوده شده و طی مراحلی، بدون آنکه نیاز به الکتروفورزیس محصول PCR باشد، آنرا خالص می سازند. اما باید توجه داشت که این کیت ها فقط جهت زدودن پروتئینها و املاح اضافه و نیز تا حد زیادی پرایمر دایمر، مفیدند. اما قادر به حذف باندهای اضافی و اسمیر ناشی از قطعات کوچک و یا DNA تک رشته ای نمی باشند. از نمونه کیت های این دسته که در بازار داخلی موجودند می توان به کیت های ساخت شرکتهای Qiagen و Bioneer اشاره کرد. کیت ساخت شرکت Bioneer جهت خالص سازی محصول PCR به نام AccuPrep PCR Purification Kit می باشد.
ب. کیت های خالص سازی DNA از ژل. در اینحال لازم است که ابتدا محصول PCR را به طور کامل بر روی ژل آگاروز الکتروفورز نموده و سپس باند مورد نظر را از روی ژل بریده و جدا کرده و به تیوبهای مخصوص بیافزائیم تا طی مراحل بعد DNA این قطعه از ژل را خالص نمائیم. این روش قادر است که DNA مورد نظر ما را تا حدود زیادی خالص کرده و باند اضافه و پرایمر دایمر و اسمیر را نیز حذف نماید. هر چند که در صورتیکه کیت مورد استفاده مرغوب نباشد ممکن است مقداری از املاح، پروتئنها و مواد اضافی دیگر موجود در ژل را در محصول نهایی داشته باشیم. کیت ساخت شرکت Bioneer جهت خالص سازی DNA از ژل AccuPrep DNA Gel Purification Kit نام دارد.
باز هم یادآوری می گردد که هنگام خرید کیت توجه نمائید که کیت خالص سازی محصول PCR را به جای کیت استخراج DNA از ژل سفارش ندهید، که به کارتان نمی آید. بیشتر شرکتهایی که در زمینه DNA sequencing فعالند، خالص سازی محصول PCR با کیت های نوع اول را هم در صورت سفارش انجام می دهند، اما استخراج DNA از ژل را خیر.
ویژگی دومی که محصولات PCR باید داشته باشند، غلظت و خلوص مناسب است.
جهت تعیین غلظت و خلوص نمونه ها از خاصیت جذب نوری این محصولات استفاده می کنیم. بدین ترتیب که با استفاده از دستگاه اسپکتروفوتومتر UV، میزان جذب پرتوها در سه طول موج 230، 260 و 280 نانومتر را خوانده و نسبت های 260/280 و 260/230 را محاسبه می کنیم. البته دستگاههای اسپکتروفوتومتر پیشرفته نظیر NanoDrop این مقادیر را بطور اتوماتیک محاسبه کرده و منحنی آنها را هم رسم می کنند. 260 نانومتر طول موجی است که اسیدهای نوکلئیک حداکثر جذب را دارند، 280 نانومتر برای تعیین غلظت پروتئینها و 230 نانومتر جهت کربوهیدراتها و برخی املاح بکار می رود.
مناسبترین نسبت 260/280 یک محلول جهت انجام sequencing حدود 1/8 است. اگر این نسبت خیلی کمتر از میزان یاد شده باشد نشانگر غلظت های بالای پروتئین یا فنل در محلول است. مناسبترین نسبت 260/230 محلول در اینحال، بین 2/2- 2 می باشد. در صورتیکه این میزان خیلی کم باشد می تواند نشاندهنده بالا بودن میزان کربوهیدراتها، فنل و یا املاحی باشد که معمولاً در بافرها استفاده می شوند. در عین حال کم بودن غلظت DNA نیز بدلیل کوچک شده صورت کسر نسبت به مخرج، این نسبت ها را کاهش میدهد. در هر صورت نامناسب بودن این نسبت ها نهایتاً می تواند نتیجه sequencing را تحت تاثیر منفی قرار دهد. لذا گاهاً لازم است که تمام مراحل آماده سازی نمونه ها را از نو انجام دهیم.
غلظت DNA در محلول نیز معمولاً توسط همین دستگاه اسپکتروفوتومتر تعیین می شود. معمولاً شرکت هایی که DNA sequencing را انجام میدهند، غلظت های حدود 100 نانوگرم بر میلی لیتر DNA را تقاضا می نمایند، که بر این اساس محلول را رقیق می نمائیم. اما در اینجا می بایست به چند نکته توجه نمود:
در صورتیکه غلظت DNA شما زیاد بود آن را خیلی رقیق نکنید. مثلاً اگر غلظت DNA حدود 300 نانو گرم هم بود، در صورتیکه حجم کافی از نمونه داشتید آن را با همین غلظت برای sequencing ارسال کرده و برای شرکت یا موسسه مورد نظر غلظت هر نمونه را با دقت ذکر نمائید. توجه داشته باشید که غلظتی که توسط اسپکتروفوتومتر بعنوان غلظت DNA خوانده می شود در واقع مجموعه ای از غلظت DNA دو رشته ای، DNA تک رشته ای، RNA و dNTP ها است. لذا همیشه میزان DNA دو رشته ای محلول ما کمتر از آن چیزی است که توسط دستگاه خوانده می شود.
در عین حال، اگر غلظت DNA در محلول شما کمتر از 100 هم بود نا امید نشوید. معمولاً در غلظتهای کمتر از این هم، اگر باندهای شارپ و واضحی داشته باشید در sequencing اشکالی پیش نمی آید. اما قبل از ارسال چنین نمونه هایی حتماً به شرکت اطلاع دهید.
واقعیت آنستکه یک نمونه با غلظت کم از DNA اما با باندهایی شارپ و نسبتهای 260/280 و 260/230 مناسب بهتر از نمونه ای با غلظت بالای DNA و purification ضعیفتر در sequencing جواب می دهد.
اما مورد دیگری که قبل از ارسال نمونه ها می بایست مشخص گردد آنستکه آیا sequencing را بصورت یک طرفه می خواهد انجام دهید یا دو طرفه؟ یعنی آیا از هر دو پرایمر جهت تعیین توالی استفاده می کنید یا کاربرد یک پرایمر را کافی میدانید. واقعیت این است که در روش تعیین توالی معمول که Sanger sequencing نامیده می شود، بدلیل آنکه قطعات تکثیر شده توسط PCR از یک ستون کروماتوگرافی رد شده و نوکلئوتیدهای انتهایی آنها خوانده می شوند (این روش در مبحث بعدی توضیح داده خواهد شد)، دستگاه قادر نیست که نوکلئوتیدهای انتهایی زنجیره های خیلی کوچک را با دقت بالا بخواند. بنابراین برای تعیین توالی بخش ابتدایی زنجیره DNA مورد نظر غالباً مجبوریم که زنجیره مکمل را هم تعیین توالی کرده و با توجه به آنها سکانس کامل زنجیره را بدست آوریم. در عین حال، خواندن دو طرفه زنجیره های مکمل، اطمینان بیشتری از درست بودن نتیجه تعیین توالی بدست می دهد. بر این اساس، در هر شرایطی بهتر آنستکه تعیین توالی بصورت دو طرفه انجام شود. اما، گاه بدلیل هزینه بر بودن فرآیند تعیین توالی را بصورت یک طرفه انجام میدهند. مثلاٌ در مطالعات اپیدمیولوژیک وقتی که بر روی گونه های مشابه تحقیق می شود و انتظار تفاوتهای زیادی در توالی نوکلئوتیدی را ندارند.
نهایتاً اینکه، ارسال نمونه ها جهت DNA sequencing در تیوبهای 1/5 تا 2 میلی لیتری انجام می شود. درب تیوبها پس از بستن می بایست کاملاً با پارافیلم seal شده باشد. تیوبها شماره گذاری شده و مشخصات نمونه ها همراه با آنها ارسال گردد. در شرایط عادی نیازی به ارسال نمونه ها در شرایط سرما نیست.
خبر خوب
با همراهی شما عزیزان یک آموزش دیگری از سری آموزش های مرکز آموزش بیوانفورماتیک نصر به اتمام رسید. امیدواریم از این آموزش تجربه محور لذت برده باشید و دنیای بیوانفورماتیک و بیوتکنولوژی را لمس کنید.
مرکز آموزش بیوانفورماتیک نصر
منبع: