در زیست شناسی ، کلمه ژن دو معنی دارد. ژن مندلی واحد اساسی وراثت است . ژن مولکولی دنباله ای از نوکلئوتیدها در DNA است که برای تولید یک RNA عملکردی رونویسی می شود . دو نوع ژن مولکولی وجود دارد: ژن های کد کننده پروتئین و ژن های غیر کد کننده. [1] [2] [3]
در طول بیان ژن (سنتز RNA یا پروتئین از یک ژن)، DNA ابتدا در RNA کپی می شود . RNA می تواند مستقیماً کاربردی باشد یا الگوی واسطه ای برای سنتز یک پروتئین باشد.
انتقال ژن ها به فرزندان ارگانیسم ، اساس وراثت صفات فنوتیپی از نسلی به نسل دیگر است. این ژنها توالیهای DNA مختلفی را میسازند که با هم ژنوتیپ نامیده میشوند ، که مختص هر فرد معینی است، در مخزن ژنی جمعیت یک گونه خاص . ژنوتیپ همراه با عوامل محیطی و رشدی در نهایت فنوتیپ فرد را تعیین می کند.
بیشتر صفات بیولوژیکی تحت تأثیر ترکیبی پلی ژن ها (مجموعه ای از ژن های مختلف) و برهمکنش های ژن-محیط رخ می دهند . برخی از صفات ژنتیکی فورا قابل مشاهده هستند، مانند رنگ چشم یا تعداد اندام ها، برخی دیگر مانند گروه خونی ، خطر ابتلا به بیماری های خاص، یا هزاران فرآیند بیوشیمیایی اساسی که زندگی را تشکیل می دهند، قابل مشاهده نیستند .
یک ژن میتواند جهشهایی را در توالی خود به دست آورد که منجر به انواع مختلفی به نام آلل در جمعیت شود . این آلل ها نسخه های کمی متفاوت از یک ژن را رمزگذاری می کنند که ممکن است باعث ایجاد صفات فنوتیپی متفاوت شود. [4] ژن ها به دلیل انتخاب طبیعی یا بقای مناسب ترین و رانش ژنتیکی آلل ها تکامل می یابند .
واژه ژن توسط گیاه شناس دانمارکی ، فیزیولوژیست گیاهی و ژنتیک ویلهلم یوهانسن در سال 1909 معرفی شد .
روش های مختلفی برای استفاده از واژه "ژن" بر اساس جنبه های مختلف توارث، انتخاب، عملکرد بیولوژیکی یا ساختار مولکولی آنها وجود دارد، اما اکثر این تعاریف به دو دسته تقسیم می شوند، ژن مندلی یا ژن مولکولی. [1] [6] [7] [8] [9]
ژن مندلی ژن کلاسیک ژنتیک است و به هر صفت ارثی اشاره دارد. این همان ژنی است که در The Selfish Gene توضیح داده شده است . [10] بحثهای کاملتر درباره این نسخه از یک ژن را میتوان در مقالههای ژنتیک و دیدگاه ژن محوری تکامل یافت .
تعریف ژن مولکولی بیشتر در بیوشیمی، زیست شناسی مولکولی و بیشتر ژنتیک استفاده می شود - ژنی که بر اساس توالی DNA توصیف می شود. [1] تعاریف مختلفی از این ژن وجود دارد که برخی از آنها گمراه کننده یا نادرست هستند. [6] [11]
کار بسیار اولیه در زمینه ای که تبدیل به ژنتیک مولکولی شد ، این مفهوم را مطرح کرد که یک ژن یک پروتئین را می سازد (در اصل "یک ژن - یک آنزیم"). [12] [13] با این حال، ژنهایی که RNAهای سرکوبگر را تولید میکنند در دهه 1950 پیشنهاد شدند [14] و در دهه 1960، کتابهای درسی از تعاریف ژن مولکولی استفاده میکردند که شامل مواردی بود که مولکولهای RNA عملکردی مانند RNA ریبوزومی و tRNA (ژنهای غیر کدکننده) را مشخص میکردند. و همچنین ژن های کد کننده پروتئین. [15]
این ایده از دو نوع ژن هنوز هم بخشی از تعریف ژن در اکثر کتاب های درسی است. به عنوان مثال،
وظیفه اصلی ژنوم تولید مولکول های RNA است. بخشهای انتخابی از توالی نوکلئوتیدی DNA در یک توالی نوکلئوتیدی RNA متناظر کپی میشود، که یا پروتئینی را کد میکند (اگر mRNA باشد) یا یک RNA ساختاری، مانند RNA انتقالی (tRNA) یا RNA ریبوزومی (rRNA) را تشکیل میدهد. مولکول هر ناحیه از مارپیچ DNA که یک مولکول RNA عملکردی تولید می کند، یک ژن را تشکیل می دهد. [16]
ما یک ژن را به عنوان یک توالی DNA که رونویسی می شود تعریف می کنیم. این تعریف شامل ژن هایی می شود که پروتئین ها را کد نمی کنند (همه رونوشت ها RNA پیام رسان نیستند). این تعریف معمولاً مناطقی از ژنوم را که رونویسی را کنترل می کنند، اما خودشان رونویسی نمی کنند، حذف می کند. ما با استثناهایی در تعریف خود از ژن مواجه خواهیم شد - در کمال تعجب، هیچ تعریفی وجود ندارد که کاملاً رضایت بخش باشد. [17]
یک ژن یک توالی DNA است که یک محصول قابل انتشار را کد می کند. این محصول ممکن است پروتئین باشد (همانطور که در اکثر ژن ها وجود دارد) یا ممکن است RNA باشد (مانند ژن هایی که برای tRNA و rRNA کد می کنند). ویژگی مهم این است که محصول به دور از محل سنتز خود منتشر می شود تا در جای دیگر عمل کند. [18]
بخشهای مهم این تعاریف عبارتند از: (1) اینکه یک ژن با یک واحد رونویسی مطابقت دارد. (2) که ژن ها هم mRNA و هم RNA های غیر کد کننده را تولید می کنند. و (3) توالی های تنظیمی بیان ژن را کنترل می کنند اما بخشی از خود ژن نیستند. با این حال، یک بخش مهم دیگر از تعریف وجود دارد که در کتاب ایجاد حس ژن ها توسط کوستاس کامپوراکیس تاکید شده است .
بنابراین در این کتاب من ژنها را بهعنوان توالیهای DNA کدکننده اطلاعات برای محصولات عملکردی، اعم از پروتئینها یا مولکولهای RNA، در نظر خواهم گرفت. منظور من از "اطلاعات رمزگذاری" این است که توالی DNA به عنوان الگویی برای تولید یک مولکول RNA یا پروتئینی استفاده می شود که عملکردی را انجام می دهد. [6]
تاکید بر عملکرد ضروری است زیرا بخشهایی از DNA وجود دارد که رونوشتهای غیرعملکردی تولید میکنند و به عنوان ژن واجد شرایط نیستند. اینها شامل نمونههای واضحی مانند شبهزایی رونویسی شده و همچنین نمونههای کمتر آشکار مانند RNA ناخواسته تولید شده به عنوان نویز به دلیل خطاهای رونویسی است. برای واجد شرایط بودن به عنوان یک ژن واقعی، با این تعریف، باید ثابت کرد که رونوشت دارای عملکرد بیولوژیکی است. [6]
گمانه زنی های اولیه در مورد اندازه یک ژن معمولی بر اساس نقشه برداری ژنتیکی با وضوح بالا و اندازه پروتئین ها و مولکول های RNA بود. طول 1500 جفت پایه در آن زمان (1965) معقول به نظر می رسید. [15] این مبتنی بر این ایده بود که ژن DNA است که مستقیماً مسئول تولید محصول عملکردی است. کشف اینترون ها در دهه 1970 به این معنی بود که بسیاری از ژن های یوکاریوتی بسیار بزرگتر از اندازه محصول عملکردی بودند. برای مثال، ژنهای کدکننده پروتئین پستانداران معمولی، حدود 62000 جفت باز هستند (منطقه رونویسی شده) و از آنجایی که حدود 20000 مورد از آنها وجود دارد، حدود 35 تا 40 درصد از ژنوم پستانداران (از جمله ژنوم انسان) را اشغال میکنند. [19] [20] [21]
علیرغم اینکه هم ژنهای کدکننده پروتئین و هم ژنهای غیرکدکننده بیش از ۵۰ سال است که شناخته شدهاند، هنوز تعدادی کتاب درسی، وبسایتها و انتشارات علمی وجود دارند که ژن را بهعنوان یک توالی DNA که پروتئین را مشخص میکند، تعریف میکنند. به عبارت دیگر، این تعریف به ژنهای کدکننده پروتئین محدود میشود. در اینجا نمونه ای از مقاله اخیر در American Scientist است.
... برای ارزیابی واقعی اهمیت بالقوه ژن های de novo، ما بر تعریف دقیق کلمه "ژن" تکیه کردیم که تقریباً هر متخصصی می تواند با آن موافق باشد. اول، برای اینکه یک توالی نوکلئوتیدی به عنوان یک ژن واقعی در نظر گرفته شود، یک چارچوب خواندن باز (ORF) باید وجود داشته باشد. ORF را می توان به عنوان "خود ژن" در نظر گرفت. با یک علامت شروع مشترک برای هر ژن شروع می شود و با یکی از سه سیگنال خط پایان ممکن پایان می یابد. یکی از آنزیمهای کلیدی در این فرآیند، RNA پلیمراز، مانند قطاری روی یک ریل مونوریل در امتداد رشته DNA میپیچد و آن را به شکل RNA پیامرسان خود رونویسی میکند. این نکته ما را به دومین معیار مهم خود می رساند: یک ژن واقعی ژنی است که هم رونویسی و هم ترجمه شود. یعنی ابتدا از یک ژن واقعی به عنوان الگویی برای ساخت RNA پیام رسان گذرا استفاده می شود که سپس به پروتئین ترجمه می شود. [22]
این تعریف محدود به قدری رایج است که مقالات اخیر بسیاری را ایجاد کرده است که این «تعریف استاندارد» را مورد انتقاد قرار داده و خواستار تعریف گسترده جدیدی است که شامل ژنهای غیر کدکننده باشد. با این حال، برخی از نویسندگان مدرن هنوز ژنهای غیرکدکننده را تایید نمیکنند، اگرچه این تعریف به اصطلاح "جدید" بیش از نیم قرن است که به رسمیت شناخته شده است. [23] [24] [25]
اگرچه برخی از تعاریف می توانند به طور گسترده تری نسبت به تعاریف دیگر قابل استفاده باشند، پیچیدگی اساسی زیست شناسی به این معناست که هیچ تعریفی از یک ژن نمی تواند تمام جنبه ها را به طور کامل نشان دهد. همه ژنوم ها DNA نیستند (به عنوان مثال ویروس های RNA )، [26] اپرون های باکتریایی چندین ناحیه کد کننده پروتئین هستند که به mRNA های بزرگ منفرد رونویسی می شوند، پیرایش جایگزین یک ناحیه ژنومی را قادر می سازد تا چندین محصول ناحیه را رمزگذاری کند و ترانس اسپلایس mRNA ها را از توالی کدگذاری کوتاه تر به هم متصل می کند. در سراسر ژنوم [27] [28] [29] از آنجایی که تعاریف مولکولی عناصری مانند اینترونها، پروموتورها و سایر نواحی تنظیمکننده را حذف میکنند ، اینها در عوض به عنوان "مرتبط" با ژن در نظر گرفته میشوند و بر عملکرد آن تأثیر میگذارند.
گاهی اوقات از یک تعریف عملیاتی حتی گستردهتر برای دربرگرفتن پیچیدگی این پدیدههای متنوع استفاده میشود، جایی که یک ژن به عنوان اتحادی از توالیهای ژنومی تعریف میشود که مجموعه منسجمی از محصولات عملکردی بالقوه با هم تداخل دارند. [30] این تعریف، ژن ها را بر اساس محصولات عملکردی آنها (پروتئین ها یا RNA) به جای مکان های DNA خاص آنها، با عناصر تنظیمی که به عنوان مناطق مرتبط با ژن طبقه بندی می شوند، دسته بندی می کند . [30]
وجود واحدهای ارثی گسسته برای اولین بار توسط گرگور مندل (1822-1884) پیشنهاد شد. [31] از سال 1857 تا 1864، در برنو ، امپراتوری اتریش (جمهوری چک امروزی)، او الگوهای وراثت را در 8000 گیاه نخود خوراکی رایج مطالعه کرد ، و صفات متمایز را از والدین تا فرزندان ردیابی کرد. او اینها را از نظر ریاضی به عنوان 2 n ترکیب توصیف کرد که در آن n تعداد ویژگی های متفاوت در نخود اصلی است. اگرچه او از واژه ژن استفاده نکرد ، اما نتایج خود را بر حسب واحدهای ارثی گسسته ای توضیح داد که منجر به ویژگی های فیزیکی قابل مشاهده می شود. این توصیف تمایز ویلهلم یوهانسن بین ژنوتیپ (ماده ژنتیکی یک موجود زنده) و فنوتیپ (ویژگی های قابل مشاهده آن ارگانیسم) را نشان می دهد. مندل همچنین اولین کسی بود که دسته بندی مستقل ، تمایز بین صفات غالب و مغلوب ، تمایز بین هتروزیگوت و هموزیگوت و پدیده وراثت ناپیوسته را نشان داد.
قبل از کار مندل، نظریه غالب وراثت نظریه ترکیبی وراثت بود ، [32] که پیشنهاد میکرد که هر یک از والدین مایعات را در فرآیند لقاح سهیم میکنند و صفات والدین با هم ترکیب و مخلوط میشوند تا فرزندان تولید کنند. چارلز داروین نظریه ای در مورد وراثت ارائه داد که او آن را pangenesis نامید ، از یونانی pan ("همه، کل") و پیدایش ("تولد") / genos ("منشا"). [33] [34] داروین اصطلاح gemule را برای توصیف ذرات فرضی که در طول تولیدمثل با هم مخلوط میشوند استفاده کرد.
کار مندل پس از اولین انتشار آن در سال 1866 تا حد زیادی مورد توجه قرار نگرفت، اما در اواخر قرن نوزدهم توسط هوگو دو وریس ، کارل کورنز و اریش فون تچرماک که (ادعا میکردند) در تحقیقات خود به نتایج مشابهی رسیدهاند، دوباره کشف شد. [35] به طور خاص، در سال 1889، هوگو دو وریس کتاب خود را به نام Intracellular Pangenesis منتشر کرد ، [36] که در آن فرض کرد که شخصیتهای مختلف حاملهای ارثی فردی دارند و وراثت صفات خاص در موجودات به صورت ذرات است. دی وری این واحدها را پس از نظریه پانژنز داروین در سال 1868، "pangenes" (به آلمانی Pangens ) نامید.
بیست سال بعد، در سال 1909، ویلهلم یوهانسن اصطلاح "ژن" [5] و در سال 1906، ویلیام بیتسون ، " ژنتیک " [37] [30] را معرفی کرد، در حالی که ادوارد استراسبورگر ، در میان دیگران، هنوز از اصطلاح "پانژن" استفاده می کرد. برای واحد فیزیکی و عملکردی اساسی وراثت. [36] : مقدمه مترجم، viii
پیشرفت در درک ژن ها و وراثت در طول قرن بیستم ادامه یافت. دئوکسی ریبونوکلئیک اسید (DNA) با آزمایشات در دهه 1940 تا 1950 نشان داده شد که مخزن مولکولی اطلاعات ژنتیکی است. [38] [39] ساختار DNA توسط Rosalind Franklin و Maurice Wilkins با استفاده از کریستالوگرافی اشعه ایکس مورد مطالعه قرار گرفت ، که باعث شد جیمز دی واتسون و فرانسیس کریک مدلی از مولکول DNA دو رشتهای را منتشر کنند که بازهای نوکلئوتیدی جفت شده آن نشان دهنده یک فرضیه قانع کننده برای مکانیسم تکثیر ژنتیکی [40] [41]
در اوایل دهه 1950، دیدگاه غالب این بود که ژنهای یک کروموزوم مانند موجودات مجزا عمل میکنند که مانند مهرههایی روی یک رشته قرار گرفتهاند. آزمایشهای بنزر با استفاده از جهشیافتههای معیوب در ناحیه rII باکتریوفاژ T4 (1955-1959) نشان داد که ژنهای منفرد ساختار خطی سادهای دارند و احتمالاً معادل بخش خطی DNA هستند. [42] [43]
در مجموع، این مجموعه از تحقیقات، جزم اصلی زیست شناسی مولکولی را ایجاد کرد ، که بیان می کند که پروتئین ها از RNA ترجمه می شوند ، که از DNA رونویسی می شود . از آن زمان نشان داده شده است که این جزم استثنایی دارد، مانند رونویسی معکوس در رتروویروس ها . مطالعه مدرن ژنتیک در سطح DNA به عنوان ژنتیک مولکولی شناخته می شود .
در سال 1972، والتر فیرز و تیمش اولین کسانی بودند که توالی یک ژن را تعیین کردند: پروتئین پوششی MS2 باکتریوفاژ . [44] توسعه بعدی توالی یابی DNA با پایان زنجیره در سال 1977 توسط فردریک سانگر، کارایی توالی یابی را بهبود بخشید و آن را به یک ابزار معمول آزمایشگاهی تبدیل کرد. [45] یک نسخه خودکار از روش سانگر در مراحل اولیه پروژه ژنوم انسانی استفاده شد . [46]
نظریه هایی که در اوایل قرن بیستم برای ادغام ژنتیک مندلی با تکامل داروینی ایجاد شد، سنتز مدرن نامیده می شود ، اصطلاحی که توسط جولیان هاکسلی معرفی شد . [47]
این دیدگاه از تکامل توسط دیدگاه ژن محوری جورج سی ویلیامز از تکامل مورد تاکید قرار گرفت . او پیشنهاد کرد که ژن مندلی واحدی از انتخاب طبیعی است با این تعریف: "آن چیزی که با فرکانس قابل ملاحظه ای جدا می شود و دوباره ترکیب می شود." [48] : 24 ایده مرتبط با تأکید بر مرکزیت ژن های مندلی و اهمیت انتخاب طبیعی در تکامل توسط ریچارد داوکینز رایج شد . [10] [49]
توسعه نظریه خنثی تکامل در اواخر دهه 1960 منجر به این شد که رانش ژنتیکی تصادفی بازیگر اصلی تکامل است و نظریه خنثی باید فرضیه صفر تکامل مولکولی باشد. [50] این منجر به ساخت درختان فیلوژنتیک و توسعه ساعت مولکولی شد که اساس تمام تکنیکهای تاریخیابی با استفاده از توالیهای DNA است. این تکنیکها محدود به توالیهای ژنی مولکولی نیستند، بلکه میتوانند بر روی تمام بخشهای DNA در ژنوم استفاده شوند.
اکثریت قریب به اتفاق موجودات، ژن های خود را در رشته های طولانی DNA (دئوکسی ریبونوکلئیک اسید) رمزگذاری می کنند. DNA از یک زنجیره ساخته شده از چهار نوع زیر واحد نوکلئوتیدی تشکیل شده است که هر کدام از یک قند پنج کربنه ( 2-دئوکسی ریبوز )، یک گروه فسفات و یکی از چهار باز آدنین ، سیتوزین ، گوانین و تیمین تشکیل شده است . [51] : 2.1
دو زنجیره DNA به دور یکدیگر میپیچند و یک مارپیچ دوگانه DNA را تشکیل میدهند که ستون فقرات فسفات-شکر در اطراف مارپیچ است، و بازها به سمت داخل با بازهای آدنین به تیمین و گوانین به سیتوزین متصل میشوند. ویژگی جفت بازها به این دلیل است که آدنین و تیمین برای تشکیل دو پیوند هیدروژنی در یک راستا قرار می گیرند ، در حالی که سیتوزین و گوانین سه پیوند هیدروژنی را تشکیل می دهند. بنابراین، دو رشته در یک مارپیچ دوتایی باید مکمل یکدیگر باشند ، به طوری که توالی پایههای آنها به گونهای باشد که آدنینهای یک رشته با تیمینهای رشته دیگر جفت شوند و غیره. [51] : 4.1
به دلیل ترکیب شیمیایی بقایای پنتوز بازها، رشته های DNA جهت دار هستند. یک انتهای یک پلیمر DNA حاوی یک گروه هیدروکسیل در معرض روی دئوکسی ریبوز است . این به عنوان انتهای 3' مولکول شناخته می شود. انتهای دیگر شامل یک گروه فسفات در معرض . این پایان 5 دقیقه است . دو رشته یک مارپیچ دوگانه در جهات مخالف یکدیگر قرار دارند. سنتز اسید نوکلئیک، از جمله همانندسازی و رونویسی DNA در جهت 5'→3' رخ می دهد، زیرا نوکلئوتیدهای جدید از طریق یک واکنش کم آبی اضافه می شوند که از 3' هیدروکسیل به عنوان نوکلئوفیل استفاده می کند . [52] : 27.2
بیان ژن های کدگذاری شده در DNA با رونویسی ژن به RNA ، نوع دوم اسید نوکلئیک که بسیار شبیه DNA است، اما مونومرهای آن حاوی ریبوز قند به جای دئوکسی ریبوز است، آغاز می شود . RNA همچنین حاوی اوراسیل پایه به جای تیمین است . مولکول های RNA نسبت به DNA پایداری کمتری دارند و معمولاً تک رشته ای هستند. ژن هایی که پروتئین ها را رمزگذاری می کنند از یک سری توالی سه نوکلئوتیدی به نام کدون تشکیل شده اند که به عنوان "کلمات" در "زبان" ژنتیکی عمل می کنند. کد ژنتیکی مطابقت را در طول ترجمه پروتئین بین کدون ها و اسیدهای آمینه مشخص می کند . کد ژنتیکی برای همه موجودات شناخته شده تقریباً یکسان است. [51] : 4.1
کل مکمل ژن در یک ارگانیسم یا سلول به عنوان ژنوم آن شناخته می شود که ممکن است روی یک یا چند کروموزوم ذخیره شود . یک کروموزوم از یک مارپیچ DNA منفرد و بسیار طولانی تشکیل شده است که هزاران ژن روی آن رمزگذاری شده است. [51] : 4.2 ناحیه کروموزوم که یک ژن خاص در آن قرار دارد، مکان آن نامیده می شود . هر مکان حاوی یک آلل از یک ژن است. با این حال، اعضای یک جمعیت ممکن است آلل های متفاوتی در جایگاه داشته باشند که هر کدام دارای توالی ژنی کمی متفاوت هستند.
اکثر ژنهای یوکاریوتی روی مجموعهای از کروموزومهای خطی و بزرگ ذخیره میشوند. کروموزوم ها در داخل هسته به صورت پیچیده با پروتئین های ذخیره ای به نام هیستون ها بسته بندی می شوند تا واحدی به نام نوکلئوزوم را تشکیل دهند . DNA بسته بندی شده و متراکم شده به این روش کروماتین نامیده می شود . [51] : 4.2 روشی که در آن DNA روی هیستون ها ذخیره می شود، و همچنین اصلاحات شیمیایی خود هیستون، تعیین می کند که آیا یک منطقه خاص از DNA برای بیان ژن در دسترس است یا خیر . علاوه بر ژنها، کروموزومهای یوکاریوتی حاوی توالیهایی هستند که تضمین میکنند DNA بدون تخریب نواحی انتهایی کپی میشود و در طول تقسیم سلولی به سلولهای دختر طبقهبندی میشود: منشاء همانندسازی ، تلومرها و سانترومر . [51] : 4.2 منشا همانندسازی، نواحی دنبالهای هستند که همانندسازی DNA برای ایجاد دو نسخه از کروموزوم آغاز میشود. تلومرها امتداد طولانی توالیهای تکراری هستند که انتهای کروموزومهای خطی را میپوشانند و از تخریب مناطق کدکننده و تنظیمکننده در طول همانندسازی DNA جلوگیری میکنند . طول تلومرها هر بار که ژنوم تکثیر می شود کاهش می یابد و در روند پیری نقش دارد . [54] سانترومر برای اتصال الیاف دوک برای جدا کردن کروماتیدهای خواهر به سلول های دختر در طول تقسیم سلولی مورد نیاز است . [51] : 18.2
پروکاریوت ها ( باکتری ها و باستانی ها ) به طور معمول ژنوم خود را در یک کروموزوم منفرد، بزرگ و دایره ای ذخیره می کنند . به طور مشابه، برخی از اندامک های یوکاریوتی حاوی یک کروموزوم حلقوی باقیمانده با تعداد کمی ژن هستند. [51] : 14.4 پروکاریوت ها گاهی اوقات کروموزوم خود را با دایره های کوچک دیگری از DNA به نام پلاسمیدها تکمیل می کنند که معمولاً تنها چند ژن را رمزگذاری می کنند و بین افراد قابل انتقال هستند. برای مثال، ژنهای مقاومت آنتیبیوتیکی معمولاً روی پلاسمیدهای باکتریایی کدگذاری میشوند و میتوانند از طریق انتقال افقی ژن بین سلولهای منفرد، حتی سلولهای گونههای مختلف، منتقل شوند . [55]
در حالی که کروموزوم های پروکاریوت ها نسبتاً از نظر ژن متراکم هستند، کروموزوم های یوکاریوت ها اغلب حاوی مناطقی از DNA هستند که هیچ عملکرد واضحی ندارند. یوکاریوت های تک سلولی ساده دارای مقادیر نسبتا کمی از چنین DNA هستند، در حالی که ژنوم موجودات چند سلولی پیچیده ، از جمله انسان، حاوی اکثریت مطلق DNA بدون عملکرد مشخص است. [56] این DNA اغلب به عنوان " DNA ناخواسته " نامیده می شود . با این حال، تجزیه و تحلیل های جدیدتر نشان می دهد که، اگرچه DNA کد کننده پروتئین به سختی 2٪ از ژنوم انسان را تشکیل می دهد ، حدود 80٪ از بازهای موجود در ژنوم ممکن است بیان شوند، بنابراین اصطلاح "DNA ناخواسته" ممکن است یک نام اشتباه باشد. [27]
ساختار یک ژن کد کننده پروتئین از عناصر بسیاری تشکیل شده است که توالی کد کننده پروتئین واقعی اغلب تنها بخش کوچکی از آنهاست. اینها شامل اینترون ها و نواحی ترجمه نشده mRNA بالغ هستند. ژنهای غیر کدکننده همچنین میتوانند حاوی اینترونهایی باشند که در طول پردازش برای تولید RNA عملکردی بالغ حذف میشوند.
همه ژن ها با توالی های تنظیمی مرتبط هستند که برای بیان آنها لازم است. اول، ژن ها به یک توالی پروموتر نیاز دارند . پروموتر توسط فاکتورهای رونویسی که جذب و به اتصال RNA پلیمراز به منطقه برای شروع رونویسی کمک می کنند، شناسایی و متصل می شود. [51] : 7.1 تشخیص معمولاً به عنوان یک توالی اجماع مانند جعبه TATA رخ می دهد . یک ژن میتواند بیش از یک پروموتور داشته باشد، در نتیجه RNAهای پیامرسان ( mRNA ) ایجاد میشود که در میزان گسترش آنها در انتهای 5' متفاوت است. [58] ژنهای بسیار رونویسیشده دارای توالیهای پروموتر «قوی» هستند که ارتباط قوی با عوامل رونویسی ایجاد میکنند و در نتیجه رونویسی را با سرعت بالایی آغاز میکنند. ژنهای دیگر دارای محرکهای ضعیفی هستند که ارتباط ضعیفی با عوامل رونویسی ایجاد میکنند و رونویسی را کمتر آغاز میکنند. [51] : 7.2 شناسایی نواحی پروموتور یوکاریوتی بسیار پیچیده تر و دشوارتر از پروموترهای پروکاریوتی است . [51] : 7.3
علاوه بر این، ژنها میتوانند دارای مناطق تنظیمی بسیاری از کیلوبازها در بالادست یا پایین دست ژن باشند که بیان را تغییر میدهند. اینها با اتصال به فاکتورهای رونویسی عمل می کنند که سپس باعث می شود DNA حلقه بزند تا توالی تنظیمی (و فاکتور رونویسی محدود) به محل اتصال RNA پلیمراز نزدیک شود. [59] برای مثال، تقویتکنندهها رونویسی را با اتصال پروتئین فعالکننده افزایش میدهند که سپس به جذب RNA پلیمراز به پروموتر کمک میکند. برعکس خفه کن ها به پروتئین های سرکوبگر متصل می شوند و DNA را برای RNA پلیمراز کمتر در دسترس قرار می دهند. [60]
RNA پیامرسان بالغ تولید شده از ژنهای کدکننده پروتئین، دارای مناطق ترجمهنشده در دو انتها است که حاوی محلهای اتصال برای ریبوزومها ، پروتئینهای متصلکننده RNA ، miRNA و همچنین کدونهای پایاندهنده و شروع و توقف هستند . [61] علاوه بر این، اکثر فریمهای خواندن باز یوکاریوتی حاوی اینترونهای ترجمهنشده هستند که حذف میشوند و اگزونهایی که در فرآیندی به نام اتصال RNA به یکدیگر متصل میشوند . در نهایت، انتهای رونوشتهای ژنی توسط سایتهای برش و پلیآدنیلاسیون (CPA) تعریف میشوند ، جایی که pre-mRNA جدید تولید شده جدا میشود و رشتهای از حدود 200 آدنوزین مونوفسفات در انتهای 3' اضافه میشود. دم poly (A) mRNA بالغ را از تخریب محافظت می کند و عملکردهای دیگری نیز دارد که بر ترجمه، محلی سازی و انتقال رونوشت از هسته تأثیر می گذارد. اتصال و به دنبال آن CPA، mRNA بالغ نهایی را تولید می کند که پروتئین یا محصول RNA را کد می کند. [62]
بسیاری از ژنهای غیر کدکننده در یوکاریوتها مکانیسمهای پایان رونویسی متفاوتی دارند و دم پلی (A) ندارند.
بسیاری از ژنهای پروکاریوتی به اپرونها سازماندهی میشوند ، با توالیهای کدکننده پروتئینهای متعدد که بهصورت یک واحد رونویسی میشوند. [63] [64] ژنهای یک اپرون بهعنوان یک RNA پیامرسان پیوسته رونویسی میشوند که به آن mRNA پلی سیسترونیک گفته میشود . اصطلاح سیسترون در این زمینه معادل ژن است. رونویسی mRNA یک اپرون اغلب توسط یک رپرسور کنترل می شود که بسته به وجود متابولیت های خاص می تواند در حالت فعال یا غیرفعال رخ دهد. [65] هنگامی که فعال است، رپرسور به یک توالی DNA در ابتدای اپرون، به نام ناحیه عملگر ، متصل می شود و رونویسی اپرون را سرکوب می کند . هنگامی که رپرسور غیرفعال است، رونویسی اپرون ممکن است رخ دهد (مثلاً اپرون لاک را ببینید ). محصولات ژن های اپرون معمولاً عملکردهای مرتبطی دارند و در یک شبکه نظارتی درگیر هستند . [51] : 7.3
اگرچه بسیاری از ژنها ساختارهای سادهای دارند، مانند بسیاری از بیولوژی، سایر ژنها میتوانند کاملاً پیچیده باشند یا نمایانگر موارد لبهای غیرعادی باشند. ژنهای یوکاریوتی اغلب اینترونها دارند که اغلب بسیار بزرگتر از اگزونهایشان هستند، [66] [67] و این اینترونها حتی میتوانند ژنهای دیگری را نیز درون خود داشته باشند . [68] تقویتکنندههای مرتبط ممکن است با فاصله زیادی کیلوبازی یا حتی روی کروموزومهای کاملاً متفاوت که از طریق تماس فیزیکی بین دو کروموزوم عمل میکنند، فاصله داشته باشند. [69] [70] یک ژن میتواند چندین محصول عملکردی مختلف را با پیوند جایگزین رمزگذاری کند، و برعکس، ژن ممکن است در کروموزومها تقسیم شود، اما آن رونوشتها با ترانس اسپلایسینگ در یک توالی عملکردی به هم متصل میشوند . [71] همچنین ممکن است ژنهای همپوشانی برخی از توالی DNA خود را، چه روی رشتههای مخالف یا همان رشته (در یک چارچوب خواندن متفاوت، یا حتی در چارچوب خواندن یکسان) به اشتراک بگذارند. [72]
در همه موجودات، دو مرحله برای خواندن اطلاعات رمزگذاری شده در DNA یک ژن و تولید پروتئین مشخص شده مورد نیاز است. ابتدا DNA ژن به RNA پیام رسان ( mRNA ) رونویسی می شود . [51] : 6.1 دوم اینکه mRNA به پروتئین ترجمه می شود. [51] : 6.2 ژن های کد کننده RNA هنوز باید مرحله اول را طی کنند، اما به پروتئین ترجمه نمی شوند. [73] فرآیند تولید یک مولکول بیولوژیکی عملکردی RNA یا پروتئین را بیان ژن و مولکول حاصل را محصول ژنی می نامند .
توالی نوکلئوتیدی DNA یک ژن، توالی اسید آمینه یک پروتئین را از طریق کد ژنتیکی مشخص می کند . مجموعهای از سه نوکلئوتید که به نام کدون شناخته میشوند ، هر کدام مربوط به یک اسید آمینه خاص هستند. [51] : 6 این اصل که سه پایه متوالی کد DNA برای هر اسید آمینه در سال 1961 با استفاده از جهشهای تغییر چارچوب در ژن rIIB باکتریوفاژ T4 نشان داده شد [74] (به آزمایش کریک، برنر و همکاران مراجعه کنید ).
علاوه بر این، یک " کدون شروع " و سه " کدون توقف " شروع و پایان ناحیه کد کننده پروتئین را نشان می دهد . 64 کدون ممکن (چهار نوکلئوتید ممکن در هر یک از سه موقعیت، بنابراین 43 کدون ممکن) و تنها 20 اسید آمینه استاندارد وجود دارد . از این رو کد اضافی است و کدون های متعدد می توانند اسید آمینه یکسانی را مشخص کنند. مطابقت بین کدون ها و اسیدهای آمینه تقریباً در بین همه موجودات زنده شناخته شده جهانی است. [75]
رونویسی یک مولکول RNA تک رشته ای به نام RNA پیام رسان را تولید می کند که توالی نوکلئوتیدی آن مکمل DNA ای است که از آن رونویسی شده است. [51] : 6.1 mRNA به عنوان یک واسطه بین ژن DNA و محصول نهایی پروتئین آن عمل می کند. DNA این ژن به عنوان الگویی برای تولید mRNA مکمل استفاده می شود . mRNA با توالی رشته کد کننده DNA ژن مطابقت دارد زیرا به عنوان مکمل رشته الگو سنتز می شود . رونویسی توسط آنزیمی به نام RNA پلیمراز انجام می شود که رشته الگو را در جهت 3' به 5' می خواند و RNA را از 5' تا 3' سنتز می کند . برای شروع رونویسی، پلیمراز ابتدا یک ناحیه پروموتور ژن را شناسایی کرده و به آن متصل می کند. بنابراین، یک مکانیسم اصلی تنظیم ژن ، مسدود کردن یا جدا کردن ناحیه پروموتر است، یا با اتصال محکم توسط مولکولهای سرکوبگر که به طور فیزیکی پلیمراز را مسدود میکنند یا با سازماندهی DNA به طوری که منطقه پروموتر در دسترس نباشد. [51] : 7
در پروکاریوت ها ، رونویسی در سیتوپلاسم رخ می دهد . برای رونوشت های بسیار طولانی، ترجمه ممکن است در انتهای 5' RNA آغاز شود در حالی که انتهای 3' هنوز در حال رونویسی است. در یوکاریوت ها ، رونویسی در هسته، جایی که DNA سلول ذخیره می شود، رخ می دهد. مولکول RNA تولید شده توسط پلیمراز به عنوان رونوشت اولیه شناخته می شود و قبل از اینکه برای ترجمه به سیتوپلاسم صادر شود، تحت تغییرات پس از رونویسی قرار می گیرد. یکی از تغییرات انجام شده، پیوند اینترون ها است که توالی هایی در ناحیه رونویسی شده هستند که پروتئینی را کد نمی کنند. مکانیسمهای پیوند جایگزین میتوانند منجر به رونوشتهای بالغ از یک ژن شوند که توالیهای متفاوتی دارند و بنابراین برای پروتئینهای مختلف کدگذاری میشوند. این یک شکل اصلی تنظیم در سلول های یوکاریوتی است و همچنین در برخی از پروکاریوت ها رخ می دهد. [51] : 7.5 [76]
ترجمه فرآیندی است که طی آن یک مولکول mRNA بالغ به عنوان الگویی برای سنتز پروتئین جدید استفاده می شود . [51] : 6.2 ترجمه توسط ریبوزوم ها ، کمپلکس های بزرگ RNA و پروتئین که مسئول انجام واکنش های شیمیایی برای افزودن اسیدهای آمینه جدید به زنجیره پلی پپتیدی در حال رشد با تشکیل پیوندهای پپتیدی هستند ، انجام می شود . کد ژنتیکی سه نوکلئوتید در یک زمان، در واحدهایی به نام کدون ، از طریق برهمکنش با مولکول های تخصصی RNA به نام RNA انتقالی (tRNA) خوانده می شود. هر tRNA دارای سه باز جفت نشده به نام آنتی کدون است که مکمل کدونی است که روی mRNA می خواند. tRNA نیز به صورت کووالانسی به اسید آمینه مشخص شده توسط کدون مکمل متصل است. هنگامی که tRNA به کدون مکمل خود در یک رشته mRNA متصل می شود، ریبوزوم محموله اسید آمینه خود را به زنجیره پلی پپتیدی جدید متصل می کند که از انتهای آمینه به انتهای کربوکسیل سنتز می شود . در طول سنتز و پس از آن، بیشتر پروتئین های جدید قبل از اینکه بتوانند عملکرد سلولی خود را انجام دهند، باید تا ساختار سه بعدی فعال خود جمع شوند . [51] : 3
ژنها طوری تنظیم میشوند که تنها زمانی بیان میشوند که محصول مورد نیاز است، زیرا بیان بر اساس منابع محدودی انجام میشود. [51] : 7 یک سلول بیان ژن خود را بسته به محیط خارجی خود (مثلاً مواد مغذی موجود ، دما و سایر تنشها )، محیط داخلی خود (مثلاً چرخه تقسیم سلولی ، متابولیسم ، وضعیت عفونت )، و نقش خاص خود در صورتی که در یک چند سلولی باشد تنظیم میکند. ارگانیسم بیان ژن را می توان در هر مرحله تنظیم کرد: از شروع رونویسی ، پردازش RNA ، تا اصلاح پس از ترجمه پروتئین. تنظیم ژن های متابولیسم لاکتوز در E. coli ( لاک اپرون ) اولین مکانیسمی بود که در سال 1961 توصیف شد. [77]
یک ژن کد کننده پروتئین معمولی ابتدا در RNA به عنوان واسطه در ساخت محصول پروتئینی نهایی کپی می شود. [51] : 6.1 در موارد دیگر، مولکولهای RNA محصولات عملکردی واقعی هستند، مانند سنتز RNA ریبوزومی و RNA انتقالی . برخی از RNA های شناخته شده به عنوان ریبوزیم قادر به عملکرد آنزیمی هستند ، در حالی که برخی دیگر مانند microRNA ها و ریبوسوئیچ ها نقش تنظیمی دارند. توالی های DNA که چنین RNA هایی از آنها رونویسی می شوند به عنوان ژن های RNA غیر کد کننده شناخته می شوند . [73]
برخی از ویروس ها کل ژنوم خود را به شکل RNA ذخیره می کنند و اصلاً حاوی DNA نیستند. [78] [79] از آنجا که آنها از RNA برای ذخیره ژن ها استفاده می کنند، میزبان سلولی آنها ممکن است پروتئین های خود را به محض آلوده شدن و بدون تاخیر در انتظار رونویسی سنتز کنند. [80] از سوی دیگر، رتروویروسهای RNA ، مانند HIV ، نیاز به رونویسی معکوس ژنوم خود از RNA به DNA قبل از سنتز پروتئینهایشان دارند.
ارگانیسم ها ژن های خود را از والدین خود به ارث می برند. موجودات غیرجنسی به سادگی یک نسخه کامل از ژنوم والدین خود را به ارث می برند. موجودات جنسی دو نسخه از هر کروموزوم دارند زیرا یک مجموعه کامل را از هر والدین به ارث می برند. [51] : 1
با توجه به وراثت مندلی ، تغییرات در فنوتیپ یک موجود زنده (ویژگی های فیزیکی و رفتاری قابل مشاهده) تا حدی به دلیل تغییرات در ژنوتیپ آن (مجموعه خاصی از ژن ها) است. هر ژن یک صفت خاص را با توالی متفاوتی از یک ژن ( آلل ها ) مشخص می کند که باعث ایجاد فنوتیپ های مختلف می شود. بیشتر موجودات یوکاریوتی (مانند گیاهان نخودی که مندل روی آنها کار کرد) برای هر صفت دو آلل دارند که یکی از هر والدین به ارث رسیده است. [51] : 20
آلل ها در یک مکان ممکن است غالب یا مغلوب باشند . آلل های غالب هنگامی که با هر آلل دیگری برای همان صفت جفت شوند، فنوتیپ های متناظر خود را ایجاد می کنند، در حالی که آلل های مغلوب تنها زمانی که با کپی دیگری از همان آلل جفت شوند، فنوتیپ متناظر خود را ایجاد می کنند. اگر ژنوتیپهای موجودات را بشناسید، میتوانید تعیین کنید که کدام آللها غالب و کدامها مغلوب هستند. به عنوان مثال، اگر آلل مشخص کننده ساقه های بلند در گیاهان نخود بر آلل مشخص کننده ساقه های کوتاه غالب باشد، گیاهان نخودی که یک آلل بلند را از یکی از والدین و یک آلل کوتاه را از والدین دیگر به ارث می برند نیز ساقه بلند خواهند داشت. کار مندل نشان داد که آللها بهطور مستقل در تولید گامتها یا سلولهای زایا ترکیب میشوند و تنوع در نسل بعدی را تضمین میکنند. اگرچه وراثت مندلی مدل خوبی برای بسیاری از صفات تعیین شده توسط ژن های منفرد (از جمله تعدادی از اختلالات ژنتیکی شناخته شده ) باقی می ماند، اما شامل فرآیندهای فیزیکی همانندسازی DNA و تقسیم سلولی نمی شود. [81] [82]
رشد، نمو و تولیدمثل موجودات متکی بر تقسیم سلولی است . فرآیندی که طی آن یک سلول منفرد به دو سلول دختر معمولاً یکسان تقسیم می شود . برای این کار ابتدا باید یک کپی تکراری از هر ژن در ژنوم در فرآیندی به نام همانندسازی DNA تهیه شود . [51] : 5.2 کپی ها توسط آنزیم های تخصصی به نام DNA polymerases ساخته می شوند که یک رشته از DNA دو مارپیچی را که به عنوان رشته الگو شناخته می شود "خوانده" می شود و یک رشته مکمل جدید را سنتز می کند. از آنجایی که مارپیچ دوگانه DNA با جفت شدن بازها به هم متصل می شود ، توالی یک رشته به طور کامل توالی مکمل آن را مشخص می کند. از این رو تنها یک رشته باید توسط آنزیم خوانده شود تا یک کپی واقعی تولید شود. فرآیند تکثیر DNA نیمه محافظه کارانه است . یعنی کپی ژنوم به ارث رسیده توسط هر سلول دختر حاوی یک رشته DNA اصلی و یک رشته جدید سنتز شده است. [51] : 5.2
سرعت تکثیر DNA در سلولهای زنده ابتدا بهعنوان نرخ ازدیاد طول DNA فاژ T4 در E. coli آلوده به فاژ اندازهگیری شد و مشخص شد که بسیار سریع است. [83] در طول دوره افزایش نمایی DNA در 37 درجه سانتیگراد، سرعت ازدیاد طول 749 نوکلئوتید در ثانیه بود.
پس از تکمیل تکثیر DNA، سلول باید به طور فیزیکی دو نسخه از ژنوم را جدا کرده و به دو سلول مجزای غشایی تقسیم شود. [51] : 18.2 در پروکاریوت ها ( باکتری ها و باستانی ها ) این معمولاً از طریق یک فرآیند نسبتاً ساده به نام شکافت دوتایی اتفاق می افتد ، که در آن هر ژنوم دایره ای به غشای سلولی متصل می شود و به سلول های دختر جدا می شود زیرا غشاء داخل غشاء می شود تا سیتوپلاسم را به دو قسمت تقسیم کند. دو بخش متصل به غشاء شکافت دوتایی در مقایسه با سرعت تقسیم سلولی در یوکاریوت ها بسیار سریع است . تقسیم سلولی یوکاریوتی فرآیند پیچیده تری است که به عنوان چرخه سلولی شناخته می شود . تکثیر DNA در مرحله ای از این چرخه به نام فاز S رخ می دهد ، در حالی که فرآیند جداسازی کروموزوم ها و شکافتن سیتوپلاسم در فاز M اتفاق می افتد . [51] : 18.1
تکثیر و انتقال مواد ژنتیکی از یک نسل سلول به نسل دیگر، مبنایی برای وراثت مولکولی و پیوند بین تصاویر کلاسیک و مولکولی ژن ها است. ارگانیسم ها ویژگی های والدین خود را به ارث می برند زیرا سلول های فرزندان حاوی نسخه هایی از ژن های سلول های والدین خود هستند. در ارگانیسم هایی که به صورت غیرجنسی تولید مثل می کنند ، فرزندان یک کپی ژنتیکی یا کلون ارگانیسم والد خواهند بود. در ارگانیسمهای در حال تولید مثل جنسی ، شکل تخصصی تقسیم سلولی به نام میوز، سلولهایی به نام گامت یا سلولهای زایا را تولید میکند که هاپلوئید هستند یا فقط یک کپی از هر ژن را شامل میشوند. [51] : 20.2 گامت های تولید شده توسط ماده ها تخمک یا تخمک و آنهایی که توسط مردان تولید می شوند اسپرم نامیده می شوند . دو گامت با هم ترکیب می شوند و یک تخمک بارور شده دیپلوئیدی را تشکیل می دهند ، یک سلول منفرد که دارای دو دسته ژن است که یک نسخه از هر ژن از مادر و یکی از پدر است. [51] : 20
در طی فرآیند تقسیم سلولی میوز، گاهی اوقات رویدادی به نام نوترکیبی ژنتیکی یا تلاقی میتواند رخ دهد که در آن طول DNA روی یک کروماتید با طول DNA روی کروماتید غیر خواهر همولوگ مربوطه مبادله میشود. این می تواند منجر به دسته بندی مجدد آلل های مرتبط دیگر شود. [51] : 5.5 اصل مندلی طبقه بندی مستقل بیان می کند که هر یک از دو ژن والدین برای هر صفت به طور مستقل به گامت ها تقسیم می شوند. کدام آللی که ارگانیسم برای یک صفت به ارث می برد، با کدام آلل برای صفت دیگر ارتباطی ندارد. این در واقع فقط برای ژن هایی صادق است که در یک کروموزوم قرار ندارند یا در یک کروموزوم بسیار دور از یکدیگر قرار دارند. هر چه دو ژن به یک کروموزوم نزدیکتر باشند، ارتباط نزدیکتری با گامتها دارند و اغلب با هم ظاهر میشوند (معروف به پیوند ژنتیکی ). [84] ژن هایی که بسیار نزدیک هستند اساسا هرگز از هم جدا نمی شوند زیرا بسیار بعید است که یک نقطه متقاطع بین آنها رخ دهد. [84]
همانندسازی DNA در اکثر موارد بسیار دقیق است، با این حال خطاها ( جهش ) رخ می دهد. [51] : 7.6 میزان خطا در سلول های یوکاریوتی می تواند به 10-8 در هر نوکلئوتید در هر تکرار باشد ، [ 85 ] [ 86] در حالی که برای برخی از ویروس های RNA می تواند تا 10-3 باشد . [87] این بدان معناست که هر نسل، هر ژنوم انسانی حدود 30 جهش جدید را جمع آوری می کند. [88] جهشهای کوچک میتوانند در اثر تکثیر DNA و پیامدهای آسیب DNA ایجاد شوند و شامل جهشهای نقطهای که در آن یک باز منفرد تغییر میکند و جهشهای تغییر چارچوب که در آن یک باز منفرد وارد یا حذف میشود، باشد. هر یک از این جهشها میتوانند ژن را با استفاده از حس نادرست (تغییر یک کدون برای رمزگذاری یک اسید آمینه متفاوت) یا بی معنی (یک کدون توقف زودرس ) تغییر دهند. [۸۹] جهشهای بزرگتر میتوانند به دلیل اشتباهات در نوترکیب ایجاد شوند و باعث ناهنجاریهای کروموزومی از جمله تکرار ، حذف، بازآرایی یا وارونگی بخشهای بزرگ کروموزوم شوند. علاوه بر این، مکانیسم های ترمیم DNA می توانند خطاهای جهشی را هنگام ترمیم آسیب فیزیکی به مولکول ایجاد کنند. تعمیر، حتی با جهش، برای بقا مهمتر از بازیابی یک کپی دقیق است، به عنوان مثال هنگام تعمیر شکستگی های دو رشته ای . [51] : 5.4
هنگامی که چندین آلل مختلف برای یک ژن در جمعیت یک گونه وجود داشته باشد، چند شکلی نامیده می شود . اکثر آلل های مختلف از نظر عملکردی معادل هستند، با این حال برخی از آلل ها می توانند صفات فنوتیپی متفاوتی را ایجاد کنند . شایع ترین آلل یک ژن نوع وحشی و آلل های نادر جهش یافته نامیده می شود . تنوع ژنتیکی در فراوانی های نسبی آلل های مختلف در یک جمعیت به دلیل انتخاب طبیعی و رانش ژنتیکی است . [90] آلل نوع وحشی لزوماً نیای اللهای کمتر رایج نیست و لزوماً مناسبتر هم نیست .
بیشتر جهشهای درون ژنها خنثی هستند و تأثیری بر فنوتیپ ارگانیسم ندارند ( جهشهای خاموش ). برخی از جهشها توالی اسید آمینه را تغییر نمیدهند زیرا کدونهای متعدد همان اسید آمینه را رمزگذاری میکنند ( جهشهای مترادف ). جهشهای دیگر میتوانند خنثی باشند اگر منجر به تغییرات توالی اسید آمینه شوند، اما پروتئین همچنان مانند اسید آمینه جدید عمل میکند (مثلاً جهشهای محافظهکارانه ). با این حال، بسیاری از جهشها مضر یا حتی کشنده هستند و با انتخاب طبیعی از جمعیت حذف میشوند. اختلالات ژنتیکی نتیجه جهش های مضر است و می تواند به دلیل جهش خود به خودی در فرد مبتلا یا ارثی باشد. در نهایت، بخش کوچکی از جهشها مفید هستند، تناسب اندام را بهبود میبخشند و برای تکامل بسیار مهم هستند، زیرا انتخاب جهت آنها منجر به تکامل تطبیقی میشود . [51] : 7.6
رابطه بین ژن ها را می توان با مقایسه توالی DNA آنها اندازه گیری کرد. اگر سطح شباهت از حداقل مقدار بیشتر شود، می توان نتیجه گرفت که ژن ها از یک اجداد مشترک منشاء می گیرند. همولوگ هستند . [۹۱] [۹۲] ژنهایی که بهواسطه نسب مستقیم از یک اجداد مشترک مرتبط هستند، ژنهای ارتولوگ هستند - آنها معمولاً در یک مکان در گونههای مختلف یافت میشوند. ژن هایی که در نتیجه یک رویداد تکراری ژن به هم مرتبط هستند، ژن های پارولوژی هستند. [93] [94]
غالباً فرض بر این است که عملکرد ژنهای ارتولوگ بیشتر از ژنهای پارالوگ شبیهتر است، اگرچه تفاوت حداقل است. [95] [96]
رایجترین منبع ژنهای جدید در دودمان یوکاریوتی ، تکثیر ژنی است که تنوع تعداد کپی یک ژن موجود در ژنوم را ایجاد میکند. [97] [98] ژنهای حاصله (پارالوگها) ممکن است از نظر توالی و عملکرد متفاوت باشند. مجموعهای از ژنهایی که از این طریق تشکیل میشوند، یک خانواده ژنی را تشکیل میدهند . تکرار ژن ها و از بین رفتن در یک خانواده رایج است و منبع اصلی تنوع زیستی تکاملی است . [99] گاهی اوقات، تکرار ژن ممکن است منجر به یک کپی غیرعملکردی از یک ژن شود، یا یک نسخه عملکردی ممکن است در معرض جهش هایی باشد که منجر به از دست دادن عملکرد می شود. به چنین ژن های غیرعملکردی، شبه ژن می گویند . [51] : 7.6
ژنهای "یتیم" که توالی آنها هیچ شباهتی به ژنهای موجود نشان نمیدهد، کمتر از ژنهای تکراری رایج هستند. ژنوم انسان شامل 18 [100] تا 60 [101] ژن بدون هیچ همولوگ قابل شناسایی در خارج از انسان است. ژنهای یتیم عمدتاً از ظهور de novo از توالیهایی که قبلاً کدگذاری نشده بودند ، یا تکثیر ژن و به دنبال آن تغییر سریع توالی به وجود میآیند که رابطه اصلی غیرقابل تشخیص میشود. [102] ژنهای De novo معمولاً از نظر ساختار کوتاهتر و سادهتر از ژنهای یوکاریوتی هستند و اینترونهای کمی دارند. [97] در طول دوره های زمانی طولانی تکاملی، تولد ژن de novo ممکن است مسئول بخش قابل توجهی از خانواده های ژنی محدود شده از نظر طبقه بندی باشد. [103]
انتقال افقی ژن به انتقال ماده ژنتیکی از طریق مکانیسمی غیر از تولید مثل اشاره دارد . این مکانیسم منبع مشترکی از ژنهای جدید در پروکاریوتها است که گاهی اوقات تصور میشود بیشتر به تنوع ژنتیکی کمک میکند تا تکثیر ژن. [104] این یک وسیله رایج برای گسترش مقاومت آنتی بیوتیکی ، حدت و عملکردهای متابولیکی تطبیقی است. [55] [105] اگرچه انتقال افقی ژن در یوکاریوت ها نادر است، نمونه های محتمل از ژنوم های پروتیست و جلبک حاوی ژن هایی با منشاء باکتریایی شناسایی شده است . [106] [107]
ژنوم کل ماده ژنتیکی یک موجود زنده است و هم ژن ها و هم توالی های غیر کد کننده را شامل می شود . [108] ژن های یوکاریوتی را می توان با استفاده از FINDER حاشیه نویسی کرد. [109]
اندازه ژنوم و تعداد ژنهایی که کدگذاری میکند بین موجودات زنده متفاوت است. کوچکترین ژنوم ها در ویروس ها ، [118] و ویروئیدها (که به عنوان یک ژن RNA غیر کدکننده منفرد عمل می کنند) رخ می دهد. [119] برعکس، گیاهان میتوانند ژنومهای بسیار بزرگی داشته باشند، [120] که برنج حاوی بیش از 46000 ژن کدکننده پروتئین است. [114] تعداد کل ژن های کد کننده پروتئین ( پروتئوم زمین ) 5 میلیون توالی تخمین زده می شود. [121]
اگرچه تعداد جفتهای پایه DNA در ژنوم انسان از دهه 1950 شناخته شده است، اما تعداد تخمینی ژنها در طول زمان به عنوان تعاریف ژنها تغییر کرده و روشهای تشخیص آنها اصلاح شده است. پیشبینیهای نظری اولیه از تعداد ژنهای انسانی در دهههای 1960 و 1970 بر اساس تخمینهای بار جهش و تعداد mRNAها بود و این تخمینها حدود 30000 ژن کدکننده پروتئین بود. [122] [123] [124] در طول دهه 1990 حدود 100000 ژن حدس زده شد و داده های اولیه در مورد شناسایی mRNA ها ( برچسب های توالی بیان شده ) بیش از ارزش سنتی 30000 ژن را که در کتاب های درسی در طول دوره گزارش شده بود، نشان می داد. دهه 1980 [125]
توالیهای پیشنویس اولیه ژنوم انسان، پیشبینیهای قبلی حدود 30000 ژن کدکننده پروتئین را تأیید کرد، اما این تخمین با پروژه حاشیهنویسی GENCODE در حال انجام به حدود 19000 کاهش یافته است . [126] تعداد ژنهای غیر کدکننده با قطعیت مشخص نیست، اما آخرین تخمینهای Ensembl حاکی از 26000 ژن غیر کدکننده است. [127]
ژنهای ضروری مجموعهای از ژنهایی هستند که تصور میشود برای بقای ارگانیسم حیاتی هستند. [129] این تعریف در دسترس بودن فراوان همه مواد مغذی مربوطه و عدم وجود تنش های محیطی را فرض می کند. تنها بخش کوچکی از ژن های موجود زنده ضروری است. در باکتری ها، تخمین زده می شود که 250 تا 400 ژن برای اشریشیا کلی و باسیلوس سوبتیلیس ضروری است که کمتر از 10 درصد از ژن های آنها است. [130] [131] [132] نیمی از این ژنها در هر دو ارگانیسم ارتولوگ هستند و تا حد زیادی در سنتز پروتئین نقش دارند . [132] در مخمر جوانه زن Saccharomyces cerevisiae تعداد ژن های ضروری کمی بیشتر است، در 1000 ژن (20٪ از ژن های آنها). [133] اگرچه اندازهگیری تعداد در یوکاریوتهای بالاتر دشوارتر است، اما تخمین زده میشود که موشها و انسانها حدود 2000 ژن ضروری (حدود 10 درصد از ژنهایشان) دارند. [134] ارگانیسم مصنوعی، Syn 3 ، دارای حداقل ژنوم از 473 ژن ضروری و ژن های شبه ضروری (برای رشد سریع ضروری است)، اگرچه 149 ژن عملکرد ناشناخته دارند. [128]
ژنهای ضروری شامل ژنهای خانهدار (برای عملکرد سلولی اساسی) [۱۳۵] و همچنین ژنهایی که در زمانهای مختلف در رشد ارگانیسمها یا چرخه زندگی بیان میشوند، هستند . [136] ژن های خانه داری به عنوان کنترل های تجربی در هنگام تجزیه و تحلیل بیان ژن استفاده می شوند ، زیرا آنها به طور اساسی در سطح نسبتاً ثابتی بیان می شوند.
نامگذاری ژن توسط کمیته نامگذاری ژن HUGO (HGNC)، کمیته ای از سازمان ژنوم انسانی ، برای هر ژن انسانی شناخته شده در قالب یک نام و نماد ژن تایید شده ( مخفف فرم کوتاه ) ایجاد شد ، که می توان از طریق یک پایگاه داده نگهداری شده توسط HGNC. نمادها به گونه ای انتخاب می شوند که منحصر به فرد باشند و هر ژن فقط یک نماد دارد (اگرچه نمادهای تایید شده گاهی تغییر می کنند). نمادها ترجیحاً با سایر اعضای یک خانواده ژنی و با همولوگها در گونههای دیگر، بهویژه موش، به دلیل نقش آن بهعنوان یک ارگانیسم مدل معمول ، سازگاری دارند . [137]
مهندسی ژنتیک اصلاح ژنوم یک موجود زنده از طریق بیوتکنولوژی است . از دهه 1970، تکنیکهای مختلفی برای افزودن، حذف و ویرایش ژنهای موجود در یک موجود زنده توسعه یافته است. [138] تکنیکهای مهندسی ژنوم که اخیراً توسعه یافتهاند، از آنزیمهای نوکلئاز مهندسی شده برای ایجاد ترمیم هدفمند DNA در کروموزوم استفاده میکنند تا یک ژن را در هنگام ترمیم شکستگی مختل یا ویرایش کنند. [139] [140] [141] [142] اصطلاح مرتبط زیست شناسی مصنوعی گاهی اوقات برای اشاره به مهندسی ژنتیک گسترده یک موجود زنده استفاده می شود. [143]
مهندسی ژنتیک اکنون یک ابزار تحقیقاتی معمول با موجودات مدل است . برای مثال، ژنها به راحتی به باکتریها اضافه میشوند [144] و دودمان موشهای حذفی با اختلال در عملکرد یک ژن خاص برای بررسی عملکرد آن ژن استفاده میشوند. [145] [146] بسیاری از موجودات از نظر ژنتیکی برای کاربرد در کشاورزی ، بیوتکنولوژی صنعتی و پزشکی اصلاح شده اند .
برای موجودات چند سلولی، معمولاً جنین مهندسی می شود که به ارگانیسم اصلاح شده ژنتیکی بالغ تبدیل می شود . [147] با این حال، ژنوم سلول ها در یک ارگانیسم بالغ را می توان با استفاده از تکنیک های ژن درمانی برای درمان بیماری های ژنتیکی ویرایش کرد.
... خود علم [یعنی مطالعه اصلاح نژاد و هیبریداسیون گیاهان] هنوز نامی ندارد، و ما فقط میتوانیم دنبالهروی خود را با پریفرازیس پیچیده و اغلب گمراهکننده توصیف کنیم. برای رفع این مشکل، برای بررسی این کنگره، اصطلاح
ژنتیک
را پیشنهاد میکنم ، که به اندازه کافی نشان میدهد که کار ما به روشن کردن پدیدههای وراثت و تنوع اختصاص دارد: به عبارت دیگر، فیزیولوژی تبار، با تأثیر ضمنی بر مسائل نظری تکامل گرا و نظام گرا، و کاربرد در مسائل عملی پرورش دهندگان، اعم از حیوانات یا گیاهان.