Gen là một đoạn xác định của phân tử axit nuclêic có chức năng di truyền nhất định.[1][2][3][4] Trong hầu hết các trường hợp, phân tử axit nuclêic này là DNA, rất ít khi là RNA (trường hợp gen là RNA hiện mới chỉ phát hiện ở một số virut).
Thuật ngữ này dịch theo phiên âm kết hợp Việt hoá từ tiếng Anh gene, cũng như từ tiếng Pháp gène (phát âm Quốc tế đều là /jēn/). Trong sinh học phổ thông cũng viết là gen (đọc là gien hoặc zen).[4][5] Gen có thể tạo ra sản phẩm của nó, gọi là sản phẩm của gen.
Thuật ngữ “gen” đóng vai trò cơ bản thiết yếu và quan trọng hàng đầu trong di truyền học. Nội hàm của thuật ngữ “gen” đã thay đổi nhiều kể từ khi di truyền học (genetics – tức khoa học về gen) ra đời (từ năm 1900) cho đến thế kỷ XIX hiện nay. Trong sinh học phân tử hiện đại cũng như di truyền học phân tử hiện đại, tính từ đầu năm 2000 đến nay, đã có ít nhất 6 định nghĩa mới về gen.[6] Bài viết này mới chỉ đề cập đến nội hàm của thuật ngữ gen ở thời kỳ mà nhiều nhà nghiên cứu lịch sử di truyền học gọi là “thời kỳ tân cổ điển” của di truyền học (khoảng từ những năm 1940 đến những năm 1970) và ít nhiều đề cập tới nội hàm tương đối mới đến những năm 1980.
Trong quá trình biểu hiện gen, trước tiên DNA được sao chép sang RNA. Phân tử RNA hoặc là có chức năng biệt hóa trực tiếp hoặc làm khuôn mẫu trung gian để tổng hợp lên protein thực hiện một chức năng nào đó. Sự chuyển giao gen đến các sinh vật thế hệ con cháu là cơ sở của tính thừa kế các tính trạng kiểu hình. Các gen tạo thành từ các trình tự DNA khác nhau gọi là kiểu gen. Kiểu gen cùng với các yếu tố môi trường và phát triển xác định lên tính trạng kiểu hình. Đa số các tính trạng sinh học chịu ảnh hưởng bởi nhiều gen (polygene, tức một tính trạng do nhiều gen khác nhau quyết định gọi là tương tác gen) cũng như tương tác giữa gen với môi trường. Một số tính trạng di truyền có thể trông thấy ngay lập tức, ví như màu mắt hoặc số chi, và một số khác thì không, như nhóm máu, nguy cơ mắc các bệnh, hoặc hàng nghìn quá trình sinh hóa cơ bản cấu thành sự sống.
Gene hoàn toàn có thể thu nạp những đột biến sinh học nằm trong trình tự của chúng, dẫn đến những biến thể, gọi là những allele, trong quần thể. Các allele này mã hóa 1 số ít phiên bản hơi khác nhau của cùng một protein, làm bộc lộ tính trạng kiểu hình khác nhau. Việc sử dụng thuật ngữ ” có một gen ” ( v. d., ” những gen tốt, ” ” gen màu tóc ” ) thường thì nhắc tới việc gồm có một allele khác nữa của cùng chung một gen .Khái niệm gen liên tục được tinh chỉnh và điều khiển để cho tương thích với những hiện tượng kỳ lạ mới tò mò gần đây. [ 7 ] Ví dụ, những vùng điều hòa của một gen hoàn toàn có thể nằm rất xa những vùng mã hóa của nó, và những vùng mã hóa này hoàn toàn có thể xen kẽ bởi những đoạn exon. Một số virus tàng trữ bộ gen của chúng trong RNA thay vì ở DNA và 1 số ít mẫu sản phẩm gen là những RNA không mã hóa có công dụng chuyên biệt. Do đó, theo nghĩa rộng, định nghĩa khoa học tân tiến về gen là bất kể đoạn locus di truyền được, đoạn trình tự trong bộ gen ảnh hưởng tác động tới những tính trạng của sinh vật được biểu lộ thành mẫu sản phẩm tính năng hoặc tham gia điều hòa bộc lộ gen. [ 8 ] [ 9 ]
Thuật ngữ gen do nhà thực vật học, sinh lý học thực vật và di truyền học người Đan Mạch Wilhelm Johannsen giới thiệu năm 1905.[10] Ông lấy gốc từ tiếng Hy Lạp cổ đại: γόνος, gonos, có nghĩa là thế hệ con cháu và sinh sản.
Gregor Mendel
Khám phá những đơn vị chức năng di truyền độc lập[sửa|sửa mã nguồn]
Sự tồn tại của các đơn vị độc lập có khả năng di truyền được đề xuất lần đầu tiên bởi nhà thực vật học Gregor Mendel (1822–1884).[11] Từ năm 1854 đến 1863, trong một tu viện ở Brno, ông đã tiến hành trồng (gần 28.000 cây) và nghiên cứu các mẫu thế hệ con cháu của 12.835 cây thực vật đậu Hà Lan, theo dõi các đặc điểm khác biệt truyền từ thế hệ này sang thế hệ khác.[12][13][14] Ông miêu tả các đặc điểm này như là tổ hợp toán học 2n với n là số các đặc điểm khác nhau trong các cây đậu gốc. Mặc dù ông không sử dụng thuật ngữ gen, ông đã giải thích các kết quả theo thuật ngữ các đơn vị rời rạc có khả năng di truyền làm xuất hiện các đặc điểm thực tế quan sát được. Nội dung miêu tả này đã có trước phát hiện phân biệt của Wilhelm Johannsen về giữa kiểu gen (vật liệu di truyền của một sinh vật) và kiểu hình (các đặc điểm trông thấy của sinh vật đó). Mendel cũng lần đầu tiên chứng tỏ quy luật phân ly độc lập, sự khác biệt giữa các tính trạng trội và tính trạng lặn, sự khác biệt giữa dị hợp tử (heterozygote) và đồng hợp tử (homozygote), và hiện tượng di truyền không liên tục.
Trước khi có nghiên cứu của Mendel, ngành sinh học đã có một số tiến bộ như: nhờ phát minh kính hiển vi sơ khai của Antonie van Leeuwenhoek (thế kỷ XVII) đã mở đường cho việc quan sát thế giới vi sinh vật, sự ra đời thuyết tế bào của Matthias Schleiden và Theodor Schwann (1838, 1839). Nhìn chung quan niệm phổ biến về di truyền thời đó vẫn là di truyền các tính trạng tập nhiễm và di truyền hòa hợp (blending inheritance), cho rằng các cá thể thừa kế từ bố mẹ một hỗn hợp pha trộn các tính trạng, ví dụ như lai cây hoa đỏ với hoa trắng sẽ cho ra hoa hồng. Charles Darwin đã phát triển một lý thuyết về di truyền mà ông gọi là pangenesis (thuyết mầm, thuyết pangen), từ tiếng Hy Lạp cổ pan (“mọi, toàn thể”) và genesis (“sự sinh”) / genos (“nguồn gốc”).[15][16] Darwin sử dụng thuật ngữ gemmule (mầm sinh) để miêu tả các hạt giả thuyết mà chúng được trộn với nhau trong quá trình sinh sản.
Tuy nhiên giới khoa học đương thời đã không hiểu và đánh giá được tầm vóc của khám phá Mendel sau khi ông công bố nghiên cứu vào năm 1866. Mãi đến năm 1900 ba nhà sinh học Hugo de Vries, Carl Correns, và Erich von Tschermak độc lập nhau đã thực hiện các thí nghiệm và đi đến các kết luận tương tự trước khi họ biết tới các nghiên cứu của Mendel.[17] Đặc biệt, năm 1889, Hugo de Vries xuất bản cuốn sách của ông Intracellular Pangenesis,[18] trong đó ông dự đoán rằng các tính trạng riêng biệt có từng đơn vị di truyền độc lập và sự kế thừa các tính trạng này trong sinh vật đến từ các hạt mầm. De Vries gọi những đơn vị này là “pangenes” (Pangens trong tiếng Đức), dựa theo lý thuyết pangenesis năm 1868 của Darwin.
Trong những năm 1902 – 1903, dựa trên những quan sát của nhiều nhà khoa học, trong đó có Walther Flemming về nhiễm sắc thể trong quy trình phân bào, hai nhà khoa học Walter Sutton và Theodor Boveri đã độc lập với nhau cùng khởi xướng Học thuyết di truyền nhiễm sắc thể. Trong bài báo của ông, Sutton nhấn mạnh vấn đề vào sự quan trọng khi ông quan sát thấy nhóm NST lưỡng bội chứa hai tập hợp có hình thái ( morphology ) giống nhau, và trong giảm phân, mỗi giao tử chỉ nhận được một NST từ mỗi cặp NST tương đương. Sau đó ông sử dụng quan sát này để lý giải những tác dụng của Mendel bằng cách giả thiết rằng những gen nằm trên nhiễm sắc thể. [ 19 ]Năm 1905, Wilhelm Johannsen đã ra mắt những thuật ngữ ‘ gene ‘, ‘ genotype ‘ và ‘ phenotype ‘ [ 10 ] và William Bateson đưa ra thuật ngữ ‘ di truyền học ‘ ( ‘ genetic ‘ ) [ 20 ] .Trong thập niên 1910, Thomas Hunt Morgan cùng với tập sự đã kiến thiết xây dựng thành công xuất sắc thuyết di truyền nhiễm sắc thể ( chromosome theory of inheritance ) dựa trên đối tượng người dùng điều tra và nghiên cứu là ruồi giấm Drosophila melanogaster. Học thuyết này xác nhận rằng gen là đơn vị chức năng cơ sở của tính di truyền nằm trên nhiễm sắc thể ( ở trong nhân ) ; trên đó những gen sắp xếp theo đường thẳng tạo thành nhóm link. [ 21 ]
Sự mày mò DNA[sửa|sửa mã nguồn]
Quá trình nghiên cứu và điều tra gen và di truyền liên tục đạt được những văn minh trong thế kỷ XX. Trước đó Friedrich Miescher ( 1869 ) đã tò mò ra một hỗn hợp trong nhân tế bào gọi là ‘ nuclein ‘ mà sau đó Albrecht Kossel ( 1878 ) đã cô lập được thành phần không phải protein trong nuclein gọi là axit deoxyribonucleic. DNA được chứng tỏ là những phân tử chứa thông tin di truyền qua những thí nghiệm triển khai trong thập niên 1940 đến thập niên 1950 [ 22 ] [ 23 ] ( xem thí nghiệm Avery – MacLeod – McCarty, thí nghiệm Hershey – Chase ). Nhờ hiệu quả nghiên cứu và điều tra cấu trúc DNA bởi Rosalind Franklin và Maurice Wilkins bằng chiêu thức tinh thể học tia X, đã giúp James D. Watson và Francis Crick đề xuất kiến nghị ra quy mô đúng về phân tử sợi xoắn kép DNA mà nguyên tắc ghép cặp nucleobase hàm ý giả thiết cho chính sách sao chép vật tư di truyền. [ 24 ] [ 25 ]Những năm đầu thập niên 1950, hầu hết những nhà sinh học có quan điểm cho rằng những gen trong một nhiễm sắc thể hoạt động giải trí giống như những đoạn rời rạc, không hề phân loại được bằng cách tái tổng hợp và sắp xếp như những hạt trên một chuỗi. Thí nghiệm của Seymour Benzer sử dụng những khuyết tật đột biến ở vùng rII của thể thực khuẩn T4 ( 1955 – 1959 ) đã chứng tỏ từng gen có một cấu trúc thẳng đơn thuần và có vẻ như là tương tự với một đoạn của sợi DNA. [ 26 ] [ 27 ]Bằng những thí nghiệm gây đột biến những gen tương quan đến những con đường sinh hóa trên nấm mốc bánh mỳ Neurospora crassa, năm 1941 George Beadle và Edward Tatum xác nhận mỗi gen trấn áp phản ứng sinh hóa tổng hợp một enzyme đặc trưng. [ 28 ] Kết quả này đưa hai ông đến giả thuyết một gen – một enzym về sau được đúng chuẩn hóa là một gen xác lập chỉ một chuỗi polypeptide, cấu trúc bậc 1 của protein, trong đó có những enzyme. [ 29 ]Từ những tác dụng nghiên cứu và điều tra thu nạp dần đã hình thành lên luận thuyết TT của sinh học phân tử, phát biểu rằng những protein được dịch mã từ RNA, mà đến lượt RNA được phiên mã từ DNA. Tuy vậy, sau này luận thuyết được chỉ ra có những ngoại lệ, ví dụ như phiên mã ngược ở retrovirus. Ngành di truyền văn minh nghiên cứu và điều tra ở Lever DNA được biết đến là di truyền phân tử .Năm 1972, Walter Fiers và tập sự ở Đại học Ghent đã lần tiên phong xác lập được trình tự của một gen : đó là gen mã hóa cho protein vỏ bọc của thể thực khuẩn MS2. [ 30 ] Những tăng trưởng sau đó của xác lập trình tự DNA bằng kỹ thuật gián đoạn chuỗi bởi Frederick Sanger năm 1977 đã nâng cao hiệu suất cao giải trình tự và giúp nó trở thành công cụ liên tục trong những phòng thí nghiệm. [ 31 ] Một kỹ thuật tự động hóa của chiêu thức Sanger đã được vận dụng ở quy trình tiến độ đầu của dự án Bất Động Sản giải thuật bộ gen ở người. [ 32 ]
Thuyết tổng hợp văn minh[sửa|sửa mã nguồn]
Một số kim chỉ nan đã được tăng trưởng đầu thế kỷ XX nhằm mục đích phối hợp giữa di truyền Mendel với thuyết tiến hóa Darwin được gọi là thuyết tổng hợp tân tiến, một thuật ngữ do Julian Huxley ra mắt. [ 33 ]
Các nhà sinh tiến hóa sau đó đã chỉnh sửa bổ sung khái niệm này, như quan điểm gen là đối tượng trung tâm của tiến hóa nêu ra bởi George C. Williams. Ông đề xuất một khái niệm gen tiến hóa như là một đơn vị của chọn lọc tự nhiên với định nghĩa: “nó là cái tách biệt và tái kết hợp với tần số phù hợp.”[34]:24 Theo quan điểm này, phân tử gen phiên mã như là một đơn vị, và gen tiến hóa kế thừa như là một đơn vị. Các ý tưởng liên quan nhấn mạnh vào vai trò trung tâm của gen trong tiến hóa được Richard Dawkins thảo luận trong các cuốn sách phổ biến khoa học.[35][36]
Cơ sở phân tử[sửa|sửa mã nguồn]
Bài chi tiết cụ thể : DNA
Hầu hết những sinh vật sống mã hóa gen của chúng trong những chuỗi dài DNA ( axit deoxyribonucleic ). DNA gồm có một chuỗi cấu thành từ bốn loại tiểu đơn vị chức năng nucleotide, mỗi tiểu đơn vị chức năng cấu trúc bởi : một đường năm cacbon ( 2 ‘ – deoxyribose ), một nhóm phosphat, và một trong bốn base adenine, cytosine, guanine, và thymine. [ 37 ] : 2.1Hai sợi DNA xoắn quanh nhau tạo thành chuỗi xoắn kép DNA với bộ khung xoắn đường-phosphat bao ngoài, và những base hướng vào trong mà adenine bắt cặp với thymine và guanine bắt cặp với cytosine. Sự bắt cặp base đặc biệt quan trọng này xảy ra do tại ở mỗi adenine và thymine hình thành 2 link hiđrô với nhau, trong khi ở mỗi cytosine và guanine hình thành 3 link hiđrô với nhau. Do vậy hai sợi trong chuỗi xoắn kép link với nhau tuân theo nguyên tắc bổ trợ, với trình tự của những base bắt cặp sao cho những adenine của một sợi được bắt cặp với những thymine sợi kia, và cứ tựa như như thế. [ 37 ] : 4.1Do đặc thù hóa học của phần dư pentose của những base, những sợi DNA có tính xác lập hướng. Một đầu cuối của polyme DNA chứa nhóm hydroxyl lộ ra khỏi deoxyribose ; vị trí này được gọi là đầu 3 ‘ của phân tử. Đầu cuối còn lại chứa nhóm phosphat lộ ra ; hay còn gọi là đầu 5 ‘. Hai sợi của chuỗi xoắn kép chạy theo hướng ngược nhau. Các quy trình tổng hợp axit nucleic, gồm có tái bản DNA và phiên mã diễn ra theo chiều đầu 5 ‘ → 3 ‘, do tại những nucleotide mới được ghép vào trải qua phản ứng khử nước khi sử dụng đầu 3 ‘ hydroxyl như là chất phản ứng nucleophile ( chất cho một cặp electron để tạo thành link hóa học ). [ 38 ] : 27.2Sự bộc lộ gen được mã hóa trong DNA mở màn bằng quy trình phiên mã gen thành RNA, một loại axit nucleic thứ hai rất giống với DNA, nhưng những monome chứa đường ribose thay cho đường deoxyribose. RNA cũng chứa base uracil thay cho thymine. Các phân tử RNA ít bền hơn DNA và thường là sợi đơn trong dạng nổi bật. Các gen mã hóa cho những protein chứa một dãy những trình tự ba nucleotide được gọi là những codon, ship hàng như những ” từ ” trong ” ngôn từ ” di truyền. Mã di truyền xác lập lên protein trong quy trình dịch mã giữa codon và amino acid. Mã di truyền gần như là như nhau ở mọi sinh vật sống đã biết. [ 37 ] : 4.1
Nhiễm sắc thể[sửa|sửa mã nguồn]
[39]Ảnh chụp qua kính hiển vi huỳnh quang cho thấy 23 cặp nhiễm sắc thể ở nữ. DNA được bộc lộ màu đỏ, với những vùng giàu những gen nội dịch ( housekeeping gene ) được bộc lộ thêm bằng màu lục. Nhiễm sắc thể lớn nhất có số lượng base lớn gấp 50 lần của NST nhỏ nhất .Toàn bộ những gen trong một sinh vật hoặc trong một tế bào được gọi là bộ gen ( genome ) của chúng, mà chúng tàng trữ trong nhiễm sắc thể. Một NST chứa một chuỗi xoắn kép DNA rất dài ( cùng với những protein tương hỗ khác ) mà trên đó có hàng nghìn gen mã hóa. [ 37 ] : 4.2 Vùng NST tại đó chứa một gen được gọi là lô-cut. Mỗi lô-cut chứa một alen của gen ; tuy nhiên, những thành viên trong một quần thể hoàn toàn có thể có những allele khác nhau tại lô-cut, mà mỗi alen hoàn toàn có thể giống nhau hoặc khác nhau không ít về trình tự nuclêôtit .Phần lớn những gen của sinh vật nhân thực được lưu trong một tập lớn, những sợi NST. Các NST được vo lại trong nhân tế bào như búi với sự tương hỗ của những protein histone để tạo thành một đơn vị chức năng gọi là nucleosome. DNA đóng gói và cô đặc theo cách này được gọi là chromatin ( chất nhiễm sắc ). [ 37 ] : 4.2 Cách thức DNA quấn bao quanh những histone, cũng như những sửa đổi hóa học của chính histone, giúp điều hòa một vùng DNA đơn cử nơi quy trình bộc lộ gen hoàn toàn có thể thực thi được. Ngoài những đoạn gene, trong nhiễm sắc thể của sinh vật nhân thực còn chứa những trình tự giúp bảo vệ quy trình tái bản DNA diễn ra thông thường mà không làm suy giảm những vùng đầu cuối DNA và giúp sắp xếp chúng vào những tế bào con trong quy trình phân bào : vùng khởi điểm tái bản ( replication origin ), telomere và tâm động ( centromere ). [ 37 ] : 4.2 Vùng khởi điểm tái bản là những vùng trình tự nơi quy trình tái bản DNA được mở màn diễn ra ( hoàn toàn có thể tại một hoặc nhiều vị trí trên NST ). Telomere ( đầu mút ) là những đoạn trình tự dài và lặp lại nằm ở những đoạn đầu hoặc sau cuối của NST có công dụng ngăn cản sự thoái hóa của những vùng trình tự điều hòa và mã hóa trong quy trình tái bản DNA. Độ dài của những telomere giảm đi mỗi lần bộ gen được sao chép và được phát hiện có tương quan đến quy trình lão hóa tế bào. [ 40 ] Vị trí tâm động là nơi những sợi thoi ( spindle fibre, hoặc microtubule ) bám vào để tách hai chromatid chị em dính nhau ở tâm động trong quy trình phân bào. [ 37 ] : 18.2Sinh vật nhân sơ ( vi trùng và vi trùng cổ ) thường thì lưu giữ bộ gen của chúng trên một sợi nhiễm sắc thể dạng vòng có size lớn ( circular chromosome, xem DNA siêu xoắn ). Tương tự, ở 1 số ít bào quan ở sinh vật nhân thực có chứa một NST mạch vòng còn sót loại mà trên đó có một số ít ít những gen. [ 37 ] : 14.4 Thỉnh thoảng sinh vật nhân sơ bổ trợ vào NST của chúng thêm những vòng nhỏ DNA gọi là plasmid, mà thường chỉ mã hóa một số ít gen và hoàn toàn có thể trao đổi được giữa những thành viên. Ví dụ, những gen có năng lực giúp vi sinh vật kháng kháng sinh và mang lại cho plasmid năng lực tự sao chép độc lập giữa những tế bào, thậm chí còn của những chủng loài khác nhau, trải qua chính sách chuyển gen ngang ( horizontal gene transfer ). [ 41 ]
Trong khi ở nhiễm sắc thể của sinh vật nhân sơ có mật độ tập trung gen tương đối cao, thì ở sinh vật nhân thực thường chứa các vùng DNA mà chức năng của nó không rõ ràng. Sinh vật nhân thực đơn bào đơn giản có tương đối ít lượng DNA như thế, trong khi bộ gen phức tạp của những sinh vật đa bào, bao gồm con người, chứa rất nhiều đoạn DNA mã vẫn chưa giải mã được chức năng của chúng.[42] Các nhà sinh học phân tử thường coi những vùng này là những đoạn DNA rác (“junk DNA”). Tuy nhiên, những phân tích gần đây gợi ý rằng mặc dù các vùng DNA mã hóa protein chỉ chiếm 2% trong bộ gen người, khoảng 80% số lượng base trong bộ gen có thể được biểu hiện, do đó “đoạn rác DNA” có thể bị sử dụng nhầm tên gọi.[9]
Cấu trúc của một gen chứa nhiều yếu tố mà những trình tự mã hóa protein thực sự chỉ là một phần nhỏ trong đó. Chúng gồm có những vùng DNA không được phiên mã cũng như những vùng RNA không được dịch mã .Tại hai bên khung đọc mở, mỗi gene chứa một trình tự điều hòa thiết yếu cho sự biểu lộ của nó. Đầu tiên, gene cần một trình tự khởi động ( promoter ). Các yếu tố phiên mã ( transcription factors ) nhận ra và link với vùng trình tự khởi động, sau đó RNA polymerase triển khai khởi phát quy trình phiên mã. [ 37 ] : 7.1 Việc nhận ra này thường nằm ở hộp TATA trong vùng khởi động. Một gene hoàn toàn có thể có nhiều hơn một vùng khởi động, làm cho những RNA thông tin ( mRNA ) khác nhau ở độ dài của đầu 5 ‘. [ 44 ] Những gene tiếp tục được phiên mã có những trình tự khởi động ” mạnh ” tức là tạo thành link mạnh với những yếu tố phiên mã, do vậy khởi phát phiên mã ở vận tốc cao. Những gene khác có những vùng trình tự khởi động ” yếu ” mà link yếu với những yếu tố phiên mã và do vậy sự phiên mã so với những gen này xảy ra ít hơn. [ 37 ] : 7.2 Các vùng trình tự khởi động ở sinh vật nhân thực có cấu trúc phức tạp hơn và khó nhận diện hơn so với ở sinh vật nhân sơ. [ 37 ] : 7.3Thêm vào đó, những gen hoàn toàn có thể chứa những vùng điều hòa có độ dài hàng kilobase nằm ở bên trái hoặc bên phải khung đọc mở dẫn đến làm biến hóa mức độ biểu lộ. Những vùng này hoạt động giải trí bằng cách link với những yếu tố phiên mã khiến cho DNA tạo thành mạch vòng do đó trình tự điều hòa ( và yếu tố phiên mã bám vào ) trở lên rất gần với RNA polymerase tại vị trí link. [ 45 ] Ví dụ, những vùng tăng cường ( enhancer ) làm tăng vận tốc phiên mã bằng cách link với một protein kích hoạt ( activator protein ) giúp kéo phân tử RNA polymerase đến vùng khởi động ; ngược lại vùng bất hoạt ( silencer ) bám với protein ức chế ( repressor protein ) làm cho DNA trở lên ít hoạt động giải trí với RNA polymerase. [ 46 ]Phân tử tiền mRNA ( pre-mRNA ) chứa những vùng không dịch mã ở cả hai đầu mà trong mỗi đầu chứa vị trí link ribosome, vùng kết thúc ( terminator ) và những codon khởi đầu và codon kết thúc. [ 47 ] Thêm vào đó, ở hầu hết khung đọc mở của sinh vật nhân thực chứa những đoạn intron không dịch mã mà sẽ được vô hiệu trước khi những đoạn exon được dịch mã. Các trình tự ở cuối mỗi intron, quyết định hành động những vị trí cắt ( splice site, RNA splicing ) để tạo ra mRNA thành thục ở đầu cuối, dùng để mã hóa cho protein hoặc mẫu sản phẩm RNA khác. [ 48 ]Nhiều gene ở sinh vật nhân sơ được tổ chức triển khai thành những đơn vị chức năng operon, với nhiều trình tự mã hóa protein được phiên mã nằm trong nó. [ 49 ] [ 50 ] Các gene trong một operon được phiên mã như thể một mRNA liên tục, mà coi nó như là polycistronic mRNA. Thuật ngữ cistron trong toàn cảnh này tương tự với khái niệm gen. Sự phiên mã của một operon của mRNA thường bị trấn áp bởi phân tử ức chế ( repressor ), mà trạng thái hoạt động giải trí hay bị cấm của sự phiên mã nhờ vào vào sự xuất hiện những chất chuyển hóa nhất định. [ 51 ] Khi phân tử ức chế hoạt động giải trí, nó bám vào một trình tự DNA nằm ở vị trí khởi đầu của operon, được gọi là vùng operator, làm cản trở sự phiên mã của operon ; khi phân tử ức chế bất hoạt, sự phiên mã ở operon hoàn toàn có thể xảy ra ( xem ví dụ Lac operon ). Các mẫu sản phẩm của gene operon thường có những công dụng tương quan và tham gia vào cùng mạng lưới điều hòa gene. [ 37 ] : 7.3
Định nghĩa theo tính năng[sửa|sửa mã nguồn]
Các nhà sinh học phân tử gặp phải khó khăn khi muốn định nghĩa chính xác phần nào của một trình tự DNA chứa một gen.[7] Các vùng điều hòa của một gen như vùng tăng cường không cần thiết phải nằm gần với trình tự mã hóa trên mạch dài phân tử bởi vì các đoạn DNA trung gian có thể tạo vòng lồi ra (loop out) giúp mang gene và vùng trình tự điều hòa của nó đến gần nhau. Tương tự, các đoạn intron của một gen có thể dài hơn rất nhiều so với các đoạn exon của nó. Các vùng điều hòa thậm chí có thể nằm hoàn toàn trên nhiễm sắc thể khác và hoạt động từ xa (in trans) khi cho phép vùng điều hòa trên một nhiễm sắc thể đến gần với các gen đích nằm trên nhiễm sắc thể khác.[52][53]
Những nghiên cứu ban đầu trong di truyền phân tử gợi ra khả năng một gen tạo một protein. Khái niệm này (ban đầu gọi là giả thuyết một gen-một enzym) bắt nguồn từ bài báo có tầm ảnh hưởng năm 1941 bởi George Beadle và Edward Tatum công bố kết quả nghiên cứu các thí nghiệm gây đột biến trên nấm mốc bánh mỳ Neurospora crassa.[28] Norman Horowitz, một trong các cộng sự ban đầu tham gia vào nghiên cứu Neurospora, nhớ lại vào năm 2004 rằng “những thí nghiệm này là cơ sở của khoa học mà Beadle và Tatum từng gọi là di truyền sinh hóa. Thực sự các kết quả của họ đã khai sinh ra ngành di truyền phân tử và tất cả những phát triển sau đó.”[54] Khái niệm một gen-một protein đã được tinh chỉnh dần từ lúc khám phá ra các gen có thể mã hóa nhiều protein bằng quá trình điều hòa cắt-nối có chọn lọc (alternative splicing) và các trình tự mã hóa tách thành những đoạn ngắn trên bộ gene mà các mRNA được ghép nối bằng quá trình xử lý cắt-nối chéo (trans-splicing).[9][55][56]
Một định nghĩa có tầm hoạt động rộng thỉnh thoảng được sử dụng để bao quát được tính phức tạp của nhiều hiện tượng phong phú, nơi một gen được định nghĩa như là hợp của các trình tự mã hóa cho một tập nhất quán các sản phẩm chuyên biệt có khả năng xen phủ lẫn nhau.[20] Định nghĩa này phân loại gene theo các sản phẩm có chức năng riêng (như protein hay RNA) hơn là theo những vị trí locus cụ thể trên đoạn DNA, với các yếu tố điều hòa được phân loại như là các vùng kết hợp với gene.[20]
Biểu hiện gene[sửa|sửa mã nguồn]
Trong mọi sinh vật, có hai bước cần thiết để đọc thông tin mã hóa trong DNA của gene và tổng hợp lên sản phẩm protein mà gene mã hóa cho. Đầu tiên, các đoạn DNA của gene được phiên mã thành RNA thông tin (mRNA).[37]:6.1 Thứ hai, mRNA được dịch mã thành protein.[37]:6.2 Các gene mã hóa trong RNA vẫn phải trải qua bước đầu tiên, nhưng không nhất thiết dịch mã thành protein.[57] Quá trình tổng hợp ra một phân tử chức năng sinh học hoặc là RNA hay protein được gọi là biểu hiện gen, và phân tử tạo thành được gọi là sản phẩm gene.
Mã di truyền[sửa|sửa mã nguồn]
Phác thảo một đoạn của phân tử RNA sợi đơn minh họa cho chuỗi bộ ba base codon. Cứ mỗi bộ ba nucleotide codon tương ứng với một amino acid khi được dịch mã thành proteinTrình tự nucleotide của DNA trong một gen xác lập lên trình tự amino acid tương ứng của protein trải qua mã di truyền. Tập hợp những bộ ba nucleotide, gọi là bộ ba mã hóa hay codon, mà mỗi codon mã hóa cho một amino acid. [ 37 ] : 6 Nguyên lý phát biểu rằng cứ ba base trong trình tự DNA mã hóa cho mỗi amino acid được dẫn chứng bằng thí nghiệm năm 1961 khi tạo đột biến di dời khung trong gene rIIB của thể thực khuẩn T4 [ 58 ] ( xem thí nghiệm Crick, Brenner và tập sự ) .
Ngoài ra, một “codon khởi động”, và ba “codon kết thúc” đánh dấu sự bắt đầu và kết thúc của vùng mã hóa protein. Có tất cả 64 codon khả dĩ (vì có bốn nucleotide ở mỗi một trong ba vị trí, do vậy tổ hợp có tất cả 43 codon) và trong tự nhiên chỉ có 20 amino acid cơ bản; do vậy số bộ ba là thừa và có nhiều codon cùng mã hóa cho một amino acid. Sự tương ứng giữa các codon và amino acido gần như là phổ biến rộng rãi ở mọi sinh vật sống đã biết trên Trái Đất.[59]
Phiên mã tạo ra phân tử RNA sợi đơn được biết đến là mRNA, mà những trình tự nucleotide trong nó tuân theo nguyên tắc bổ trợ với của DNA làm gốc để phiên mã nó. [ 37 ] : 6.1 mRNA có vai trò làm khuôn mẫu trung gian giữa DNA của gene và mẫu sản phẩm protein ở đầu cuối. DNA của gene được sử dụng làm khuôn để tổng hợp lên mRNA theo nguyên tắc ghép cặp bổ trợ. mRNA khớp với trình tự của dải mã hóa ( coding strand ) trong DNA của gene do tại nó được tổng hợp như là sợi bổ trợ của dải khuôn mẫu ( template strand ). Phiên mã được thực thi bằng enzyme gọi là RNA polymerase, khi nó đọc và thực thi trượt theo dải khuôn mẫu theo hướng đầu 3 ‘ đến đầu 5 ‘ ; và tổng hợp lên RNA theo hướng ngược lại từ đầu 5 ‘ đến đầu 3 ‘. Để khởi phát phiên mã, phân tử polymerase tiên phong nhận ra và bám vào vùng khởi động của gen. Do vậy, chính sách chính của điều hòa biểu lộ gen là ngăn ngừa hoặc cô lập vùng khởi động, hoặc trải qua những phân tử ức chế ( repressor ) có công dụng ngăn ngừa polymerase, hoặc bằng cách tổ chức triển khai DNA sao cho không hề tiếp cận được vùng khởi động. [ 37 ] : 7Ở sinh vật nhân sơ, quy trình phiên mã xảy ra trong tế bào chất ; so với phân tử phiên mã rất dài, sự dịch mã hoàn toàn có thể khởi đầu tại đầu 5 ‘ của RNA trong khi ở đầu 3 ‘ của nó vẫn đang trong quy trình phiên mã. Ở sinh vật nhân thực, phiên mã xảy ra trong nhân tế bào, nơi lưu giữ DNA và nhiễm sắc thể. Phân tử RNA được tổng hợp bằng polymerase được gọi là bản sao sơ cấp ( primary transcript ) và trải qua một quy trình sửa đổi hậu phiên mã ( post-transcriptional modification ) trước khi trở thành mRNA thành thục và được chuyển ra khỏi nhân vào tế bào chất để sẵn sàng chuẩn bị cho dịch mã. Một trong những sửa đổi được triển khai đó là cắt-nối những đoạn intron là những trình tự trong vùng phiên mã nhưng không mã hóa cho protein. Cơ chế cắt-nối có tinh lọc ( alternative splicing ) hoàn toàn có thể cho những bản sao thành thục từ cùng một gen nhưng mRNA có trình tự khác vào do vậy nó mã hóa cho những protein khác. Đây là chính sách điều hòa chính ở tế bào nhân thực và cũng Open ở một vài tế bào nhân sơ. [ 37 ] : 7.5 [ 60 ] Bên trái : Các gene mã hóa protein được phiên mã thành mRNA trung gian, sau đó nó được dịch mã thành protein có công dụng nhất định. Bên phải : Các gene mã hóa cho RNA mà được phiên mã thành những RNA không mã hóa có tính năng chuyên biệt. ( )Dịch mã là quy trình trong đó một phân tử mRNA thành thục được sử dụng là khuôn mẫu để tổng hợp lên protein mới. [ 37 ] : 6.2 Dịch mã được thực hện bằng những ribosome, những phức tạp lớn chứa RNA và protein chịu nghĩa vụ và trách nhiệm triển khai những phản ứng hóa sinh để ghép nối thêm những amino acid mới do tRNA mang đến tạo thành một chuỗi polypeptide đang dài dần ra dựa trên link peptide. Mã di truyền được đọc ba nucleotide trong một lần, theo những đơn vị chức năng gọi là codon mã hóa, trải qua tương tác với những phân tử RNA biệt hóa gọi là RNA luân chuyển ( tRNA ). Mỗi tRNA có ba base không được ghép cặp gọi là những codon đối mã ( anticodon ) mà bắt cặp bổ trợ với codon nó đọc được từ mRNA. tRNA trải qua link cộng hóa trị gắn với amino acid mà chỉ khớp riêng với codon của tRNA đó. Khi tRNA bắt khớp với codon bổ trợ trên dải mRNA, ribosome lập tức gắn amino acid nó mang tới vào chuỗi polypeptide đang được tổng hợp, mà có chiều từ đầu amin đến đầu carboxyl. Trong lúc và sau tổng hợp, hầu hết protein mới hình thành phải trải qua bước uốn gập về cấu trúc ba chiều hoạt động giải trí trước khi chúng triển khai tham gia những công dụng trong tế bào hoặc được đẩy ra khỏi tế bào. [ 37 ] : 3
Các gene được điều hòa sao cho chúng chỉ biểu hiện khi các sản phẩm gene ở mức cần thiết, vì quá trình biểu hiện tiêu tốn những nguồn dự trữ hạn chế.[37]:7 Một tế bào điều hòa biểu hiện các gen của nó phụ thuộc vào môi sinh (ví dụ chất dinh dưỡng nhiều hay ít, nhiệt độ và các sức ép-stress), môi trường bên trong tế bào (ví dụ chu kỳ phân bào, trao đổi chất, trạng thái lây nhiễm), và vai trò cụ thể của nó trong một sinh vật đa bào. Biểu hiện gene có thể được điều hòa ở bất kỳ một bước nào: từ lúc khởi phát phiên mã, đến xử lý RNA, đến sửa đổi sau dịch mã đối với protein. Sự điều hòa các gen kiểm soát trao đổi chất của đường lactose ở E. coli (lac operon) là một trong những cơ chế điều hòa đầu tiên được François Jacob và Jacques Monod miêu tả vào năm 1961.[51]
Các gene sinh RNA không mã hóa[sửa|sửa mã nguồn]
Một gene mã hóa protein nổi bật thường tiên phong sao chép sang RNA như là một phân tử trung gian trong quy trình tổng hợp ra protein ở đầu cuối. [ 37 ] : 6.1 Trong trường hợp khác, những phân tử RNA là những mẫu sản phẩm có tính năng chuyên biệt, như vai trò trong tổng hợp RNA ribosome và RNA luân chuyển. Một số RNA được biết đến là những ribozyme có năng lực hoạt động giải trí như enzyme, và microRNA có vai trò điều hòa. Trình tự DNA từ đó mà RNA được phiên mã thành những RNA có công dụng chuyên biệt được gọi là những gene sinh RNA không mã hóa. [ 57 ]Ở 1 số ít virus chúng tàng trữ hàng loạt bộ gene của chúng trong dạng của RNA, và không hề chứa một trình tự DNA nào. [ 61 ] [ 62 ] Bởi vì chúng sử dụng RNA để lưu giữ những gene, những tế bào vật chủ hoàn toàn có thể tổng hợp lên những protein thiết yếu cho virus ngay khi chúng lây nhiễm vào vật chủ và không cần phải đợi xảy ra tiến trình phiên mã. [ 63 ] Mặt khác, ở những RNA retrovirus, như HIV, chúng yên cầu phải có quy trình phiên mã ngược từ bộ gene của chúng là RNA sang DNA trước khi protein của virus được tổng hợp ra. Di truyền học ngoài gene ( epigenetics ) do RNA trung gian cũng đã được quan sát thấy ở một số ít thực vật nhưng rất hiếm có ở động vật hoang dã. [ 64 ] Sự thừa kế từ một gen có hai allele khác nhau ( lam và trắng ). Gene này nằm trên nhiễm sắc thể thường ( không phải là NST giới tính ). Allele trắng là tính trạng lặn so với tính trạng trội do allele lam pháp luật. Xác suất cho bộc lộ những tính trạng ở thế hệ con bằng một phần tư, hay 25 Xác Suất .Bộ gene những sinh vật thừa kế từ gene trong thế hệ cha mẹ của chúng. Các sinh vật sinh sản vô tính chỉ đơn thuần là thừa kế bản sao không thiếu của bộ gene cha mẹ chúng. Các sinh vật sinh sản hữu tính có hai bản sao ở mỗi nhiễm sắt thể chính do chúng thừa kế một bộ khá đầy đủ từ mỗi con cháu và con đực. [ 37 ] : 1
Di truyền Mendel[sửa|sửa mã nguồn]
Theo di truyền Mendel, những biến dị trong kiểu hình của một sinh vật ( những đặc thù vật lý và cư xử quan sát được ) là một phần do những đổi khác trong kiểu gene ( đặc biệt quan trọng là những gen tương ứng ). Mỗi gene xác lập một tính trạng riêng với những trình tự khác nhau trên cùng một gen ( những allele ) làm Open nhiều kiểu hình khác nhau. Hầu hết những sinh vật nhân thực ( như ở cây đậu Hà Lan mà Mendel dùng để điều tra và nghiên cứu ) có hai allele cho mỗi tính trạng, mỗi allele được kế thừa từ bố hoặc mẹ. [ 37 ] : 20Tại locus những allele hoàn toàn có thể là trội hoặc lặn ; những allele trội biểu lộ những kiểu hình tương ứng khi nó ghép cặp với bất kể một allele khác của tính trạng, trong khi những allele lặn chỉ biểu lộ kiểu hình tương ứng khi nó ghép cặp với cùng một bản sao allele khác. Nếu biết kiểu hình của sinh vật, hoàn toàn có thể xác lập được allele trội và allele lặn. Ví dụ, nếu allele xác lập thân cây cao ở đậu Hà Lan là tính trạng trội so với allele xác lập thân cây thấp, thì ở thực vật đậu thừa kế một allele allele cao từ cha mẹ và một allele thấp từ cha mẹ thì nó sẽ là thân cây cao. Nghiên cứu của Mendel chứng tỏ rằng những allele phân ly độc lập trong hình thành giao tử, hoặc những tế bào gốc, bảo vệ biến hóa ở thế hệ tiếp theo. Mặc dù di truyền Mendel vẫn là một quy mô tốt cho nhiều tính trạng xác lập bởi những gen riêng rẽ ( gồm có 1 số ít bệnh di truyền hay gặp ) nó không kể đến những quy trình sinh hóa trong tái bản DNA và phân bào. [ 65 ] [ 66 ]
Tái bản DNA và phân bào[sửa|sửa mã nguồn]
Các sinh vật sinh trưởng, tăng trưởng và sinh sản dựa vào sự phân bào ; quy trình trong đó một tế bào phân loại thành hai tế bào con. Để triển khai được như vậy tiên phong trong nhân tế bào cần triển khai sao chép từng gene trong bộ gene trải qua chính sách tái bản DNA. [ 37 ] : 5.2 Quá trình tái bản được triển khai nhờ những enzyme chuyên biệt mà trong số đó là DNA polymerase, phân tử này triển khai ” đọc ” một sợi trong hai sợi xoắn kép DNA đã được tháo xoắn, hay còn gọi sợi này là sợi khuôn, và tổng hợp lên một sợi bổ trợ mới. Bởi vì chuỗi xoắn kép DNA được link với nhau bởi những cặp base bổ trợ, từ trình tự của một sợi hoàn toàn có thể trọn vẹn xác lập lên trình tự bổ trợ ; do vậy enzyme chỉ cần đọc một sợi là hoàn toàn có thể tạo ra một bản sao không thiếu. Quá trình tái bản DNA tuân theo nguyên tắc bán bảo toàn ; tức là, bản sao của bộ gene thừa kế trong mỗi tế bào con chứa một sợi gốc từ cha mẹ và một sợi DNA mới tổng hợp. [ 37 ] : 5.2
Tốc độ tái bản DNA trong tế bào sống lần đầu tiên được xác định là ở tốc độ kéo dài DNA của thể thực khuẩn T4 trong E. coli bị nhiễm phage và các nhà sinh học phát hiện thấy nó có một tốc độ nhanh đáng kinh ngạc.[67] Trong giai đoạn sao chép DNA ở nhiệt độ 37 °C, tốc độ kéo dài bằng 749 nucleotide trên một giây.
Sau khi quy trình tái bản DNA kết thúc, tế bào phải trải qua sự chia tách của hai bản sao bộ gene và phân loại thành hai tế bào có màng phân biệt. [ 37 ] : 18.2 Ở sinh vật nhân sơ ( vi trùng và vi trùng cổ ) quy trình này tương đối đơn thuần biểu lộ qua sự phân loại đôi ( binary fission ), trong đó mỗi bộ gene trên mạch vòng gắn vào màng tế bào và được tách ra thành những tế bào khi màng tế bào lộn vào trong ( invagination ) và tách tế bào chất ra thành hai phần ngăn nhau bởi màng tế bào. Quá trình phân loại đổi xảy ra cực kỳ nhanh so với vận tốc phân bào ở sinh vật nhân thực. Tế bào của sinh vật nhân thực phân loại diễn ra phức tạp hơn như trong chu kỳ luân hồi tế bào ; sự tái bản DNA xảy ra trong pha S, trong khi quy trình tách nhiễm sắc thể và bào tương xảy ra trong pha M. [ 37 ] : 18.1
Di truyền phân tử[sửa|sửa mã nguồn]
Drosophila melanogaster của tần số tái tổ hợp của sự kiện trao đổi giữa các allele.[68]Bản đồ di truyền link ởcủa Thomas Hunt Morgan. Đây là nghiên cứu và điều tra thành công xuất sắc tiên phong trong việc lập map gene ( xác lập vị trí những gen trên NST ) và phân phối vật chứng quan trọng cho kim chỉ nan di truyền trên nhiễm sắc thể. Bản đồ chỉ ra vị trí tương đối của những allele trên NST số 2 của Drosophila. Khoảng cách giữa những gen ( đơn vị chức năng đo centimorgan ) tỷ suất thuận vớicủa sự kiện trao đổi giữa những allele .Sự tái bản và truyền vật tư di truyền từ một thế hệ tế bào sang thế hệ tiếp theo là cơ sở của di truyền phân tử, và là mối liên hệ giữa bức tranh phân tử với bức tranh cổ xưa của gen. Sinh vật thừa kế những đặc tính từ cha mẹ do tại những tế bào con chứa những bản sao của gene từ trong tế bào của cha mẹ chúng. Ở những sinh vật sinh sản vô tính, ở thế hệ con sẽ chứa bản sao di truyền hay dòng hóa từ những sinh vật cha mẹ. Ở sinh vật sinh sản hữu tính, một tiến trình đặc biệt quan trọng của quy trình phân bào gọi là giảm phân tạo thành những tế bào giao tử hoặc tế bào mầm phôi đơn bội, và chỉ chứa gene trong nhiễm sắc thể đơn bội. [ 37 ] : 20.2 Giao tử phát sinh từ con cháu gọi là trứng hay ova, và giao tử phát sinh từ con đực gọi là tinh trùng. Hai giao tử phối hợp với nhau tạo thành hợp tử lưỡng bội trứng đã được thụ tinh, một tế bào trong nó chứa hai tập hợp gene, với một bản sao của mỗi gene đến từ con cháu và một bản sao còn lại từ con đực. [ 37 ] : 20
Trong quá trình phân bào giảm phân, thỉnh thoảng xuất hiện sự kiện tái tổ hợp di truyền hay trao đổi chéo ở một số đoạn giữa hai nhiễm sắc thể tương đồng, kéo theo sự trao đổi các gen giữa chúng. Ở sự kiện này, một đoạn DNA trên một chromatid được hoán vị bằng một đoạn DNA có độ dài bằng nhau nằm trên chromatid tương đồng khác chị em. Hiện tượng này có thể dẫn đến sự tổ chức lại các allele đã có liên kết với nhau.[37]:5.5 Quy luật phân ly độc lập của Mendel khẳng định mỗi gene từ bố hoặc mẹ cho mỗi tính trạng sẽ sắp xếp một cách độc lập trong giao tử; hay các allele của các gen khác nhau thì phân ly một cách độc lập với nhau trong quá trình hình thành giao tử. Điều này chỉ đúng cho những gene mà không nằm trên cùng một nhiễm sắc thể, hoặc nằm trên cùng một nhiễm sắc thể nhưng cách rất xa nhau. Hai gene nằm càng gần nhau trên cùng một nhiễm sắc thể, chúng sẽ càng có mặt cùng nhau trong giao tử và các tính trạng chúng biểu hiện sẽ xuất hiện cùng nhau thường xuyên; những gene nằm rất gần nhau hoặc cạnh nhau về cơ bản không bao giờ bị tách biệt bởi vì rất hiếm khi điểm trao đổi chéo sẽ xuất hiện giữa hai gene này. Đây là cơ sở của hiện tượng di truyền liên kết gene hoàn toàn (genetic linkage).[69]
Ruồi giấm Drosophila melanogaster đã được nhà di truyền học người Mỹ, Thomas Hunt Morgan (1866-1945), sử dụng trong nghiên cứu di truyền học từ những năm đầu của thế kỷ XX, trong khi đang làm việc tại Học viện Công nghệ California. Nhờ sử dụng ruồi giấm này, Morgan và các cộng sự của mình đã xây dựng thành công học thuyết di truyền nhiễm sắc thể. Lý thuyết này đã khẳng định gene – đơn vị di truyền then chốt đóng ba vai trò: (i) Gene là đơn vị chức năng, nghĩa là gene được xem như một thể thống nhất toàn vẹn kiểm soát một tính trạng cụ thể. (ii) Gene là đơn vị tái tổ hợp, nghĩa là gene không bị chia nhỏ bởi sự trao đổi chéo (vì theo quan điểm này, trao đổi chéo không xảy ra bên trong phạm vi một gen mà chỉ xảy ra giữa các gene); như thế gene được coi là đơn vị cấu trúc cơ sở của vật chất di truyền, nhiễm sắc thể. (iii) Gene là đơn vị đột biến, nghĩa là nếu đột biến xảy ra trong gene dù ở bất kỳ vị trí nào hoặc với phạm vi ra sao, chỉ gây ra một trạng thái cấu trúc mới tương ứng với một kiểu hình mới, kiểu hình đột biến, khác với kiểu hình bình thường. Tuy nhiên, quan niệm này vẫn còn chưa rõ ràng và không thực sự chính xác theo quan điểm của di truyền học hiện đại[68]
Các đổi khác ở mức phân tử[sửa|sửa mã nguồn]
Giai đoạn tái bản DNA diễn ra phần đông có độ đúng mực cao, tuy nhiên cũng có lỗi ( đột biến ) xảy ra. [ 37 ] : 7.6 Tần suất lỗi ở tế bào sinh vật nhân thực hoàn toàn có thể thấp ở mức 10 − 8 trên nucleotide trong mỗi lần tái bản, [ 70 ] [ 71 ] trong khi ở một số ít virus RNA hoàn toàn có thể cao tới cả 10 − 3. [ 72 ] Điều này có nghĩa là ở mỗi thế hệ, trong bộ gene ở người thu thêm 1 – 2 đột biến mới. [ 72 ] Những đột biến nhỏ Open từ quy trình tái bản DNA và hậu quả từ hủy hoại DNA và gồm có đột biến điểm trong đó một base bị đổi khác và đột biến di dời khung trong đó một base được thêm vào hay bị xóa. Hoặc là những đột biến này làm đổi khác gene theo cách làm sai nghĩa ( missense mutation, biến hóa một codon làm nó mã hóa cho amino acid khác ) hoặc làm cho gene trở nên không có ý nghĩa ( nonsense mutation, làm quy trình tái bản DNA sớm kết thúc khi đọc đến codon kết thúc và mẫu sản phẩm gene là protein không hoạt động giải trí được ). [ 73 ] Những đột biến lớn hơn hoàn toàn có thể gây ra lỗi trong tái tổng hợp dẫn đến những không bình thường ở nhiễm sắc thể ( chromosomal abnormality ) gồm có nhân đôi một gen ( gene duplication ), xóa, sắp xếp lại hoặc đảo ngược những đoạn dài trong một NST. Thêm vào đó, chính sách sửa chữa thay thế DNA hoàn toàn có thể dẫn ra vài đột biến mới khi triển khai sửa chữa thay thế những sai hỏng vật lý ở phân tử. Sự thay thế sửa chữa, ngay cả khi đi kèm với đột biến, là quan trọng hơn so với sự sống sót hơn là Phục hồi lại bản sao đúng mực, ví dụ khi triển khai sửa chữa thay thế chuỗi xoắn kép bị gãy. [ 37 ] : 5.4
Khi nhiều allele khác nhau của cùng một gen có mặt trong quần thể một loài thì hiện tượng này được gọi là đa hình (polymorphism). Phần lớn các allele khác nhau hoạt động tương tự nhau, tuy nhiên ở một số allele có thể làm xuất hiện các tính trạng kiểu hình khác nhau. Allele phổ biến nhất của một gen được gọi là kiểu dại (wild type), và những allele hiếm được gọi là allele đột biến. Biến dị di truyền trong tần số tương đối của các allele khác nhau trong một quần thể có nguyên nhân từ cả chọn lọc tự nhiên và biến động di truyền (genetic drift, những sự biến đổi ngẫu nhiên vô hướng về tần số allele trong tất cả các quần thể, nhưng đặc biệt là ở các quần thể nhỏ).[74]
Phần lớn những đột biến bên trong những gen là đột biến trung tính ( neutral mutation ), không có ảnh hưởng tác động đến kiểu hình của sinh vật ( đột biến lặng, silent mutation ). Một số đột biến không làm đổi khác trình tự amino acid chính do 1 số ít codon mã hóa cho cùng một amino acid ( đột biến đồng nghĩa tương quan, synonymous mutation ). Các đột biến khác trở thành trung tính nếu tuy nó làm đổi khác trình tự amino acid, nhưng protein vẫn gập nếp và hoạt động giải trí thông thường với amino acid mới ( đột biến bảo toàn, conservative mutation ). Tuy nhiên, nhiều đột biến là có hại ( deleterious mutation ) hay thậm chí còn gây chết ( lethal allele ), và bị vô hiệu khỏi quần thể bằng quy trình tinh lọc. Rối loạn di truyền ( genetic disorders ) là hiệu quả của những đột biến có hại và hoàn toàn có thể do đột biến tự phát trong thành viên bị tác động ảnh hưởng, hoặc hoàn toàn có thể di truyền sang thế hệ sau. Cuối cùng, có một tỷ suất nhỏ những đột biến là có lợi ( beneficial mutation ), tăng cường mức độ tương thích ( fitness ) ở sinh vật, và trở thành một trong những vấn đề quan trọng của thuyết tiến hóa tổng hợp văn minh, vì trong tinh lọc có hướng dẫn đến tiến hóa thích nghi. [ 37 ] : 7.6
Trình tự tương đương[sửa|sửa mã nguồn]
Kết quả sắp trình tự tạo ra bằng ClustalO, cho những protein histone ở động vật hoang dã có vú .Gene có nguồn gốc tổ tiên chung gần nhất, và do vậy san sẻ cùng một lịch sử vẻ vang mày mò, được biến đến có tính tương đương. [ 75 ] Những gene này Open hoặc từ sự lặp đoạn gene bên trong bộ gene của sinh vật, nơi chúng được gọi là những gen môi sinh, hoặc là hiệu quả của sự phân tán gene sau một sự kiện hình thành loài, [ 37 ] : 7.6 và thường triển khai những tính năng giống nhau hoặc tựa như như ở sinh vật tương quan. Người ta thường giả sử rằng những gene này có sự giống nhau nhiều hơn so với gene môi sinh, mặc dầu sự khác nhau là nhỏ. [ 76 ] [ 77 ]Mối liên hệ giữa những gen hoàn toàn có thể đo được bằng cách so sánh sắp trình tự trong DNA của chúng. [ 37 ] : 7.6 Độ giống nhau giữa những gen tương đương được gọi là trình tự bảo toàn ( conserved sequence ). Theo thuyết tiến hóa phân tử trung tính, phần đông những biến hóa trong trình tự của một gen không tác động ảnh hưởng đến công dụng của nó và do vậy gene tích góp những đột biến theo thời hạn. Thêm vào đó, bất kể tinh lọc nào trên một gen sẽ làm cho trình tự của nó phân tán với vận tốc khác. Các gene chịu tác động ảnh hưởng tinh lọc không thay đổi có tính không thay đổi cao và sự biến hóa so với chúng diễn ra chậm trong khi những gen chịu ảnh hưởng tác động tinh lọc khuynh hướng biến hóa trình tự một cách nhanh gọn. [ 78 ] Sự khác nhau trong trình tự giữa những gen hoàn toàn có thể được ứng dụng để nghiên cứu và phân tích phát sinh chủng loài để điều tra và nghiên cứu những gen đã tiến hóa bằng cách nào và bằng cách nào mà những sinh vật trở lên có tương quan đến nhau. [ 79 ] [ 80 ]
Nguồn gốc những gen mới[sửa|sửa mã nguồn]
Số phận tiến hóa của những gen lặp đoạn .Nguồn gốc chung thông dụng ở những gen mới trong nòi giống sinh vật nhân thực là lặp đoạn gene, trong đó tạo ra một bản sao gene mới từ gene đã có trong bộ gene. [ 81 ] [ 82 ] Những gene tạo ra này sau đó hoàn toàn có thể phân tán trong trình tự và tính năng. Tập hợp những gen hình thành theo cách này tạo thành mái ấm gia đình gene ( gene family ). Các nhà tiến hóa cho rằng lặp đoạn gene và mất gene trong một mái ấm gia đình là thông dụng và là nguyên do hầu hết dẫn đến sự đa dạng sinh học. [ 83 ] Thình thoảng, lặp đoạn gene hoàn toàn có thể tạo ra một bản sao không hoạt động giải trí thông thường, hoặc bản sao công dụng chịu ảnh hưởng tác động của đột biến làm mất công dụng ; những gene không hoạt động giải trí này được gọi là gene giả ( pseudogene ). [ 37 ] : 7.6Các gene ” mồ côi “, mà trình tự không giống với một gen đã có nào, ít gặp hơn so với lặp đoạn gen. Ước tính số lượng gene mà không có trình tự tương đương nằm bên ngoài con người từ 18 [ 84 ] đến 60. [ 85 ] Hai nguồn đa phần của những gen mồ côi mã hóa protein đó là quy trình lặp đoạn gene theo sau bởi sự biến hóa trình tự cực lớn, như mối liên hệ gốc là không xác lập được từ việc so sánh trình tự, và sự chuyển đổi mới từ một trình tự không mã hóa trước đó thành một gen mã hóa protein. [ 86 ] Các gene mới thường ngắn hơn và đơn thuần hơn về cấu trúc so với những gen ở sinh vật nhân thực, mà chỉ có vài intron ( nếu có ). [ 81 ] Các nhà sinh tiến hóa cho rằng trong thời hạn tiến hóa dài, gene mới sinh hoàn toàn có thể chịu nghĩa vụ và trách nhiệm cho một tỷ suất đáng kể những mái ấm gia đình gene bị số lượng giới hạn về mặt chủng loại. [ 87 ]Quá trình chuyển gene ngang nhắc tới sự truyền vật tư di truyền trải qua một chính sách hơn là sự sinh sản. Cơ chế này là nguồn thường gặp tạo gene mới ở sinh vật nhân sơ, mà đôi lúc được cho là góp phần nhiều hơn vào biến dị di truyền so với lặp đoạn gene. [ 88 ] Nó là một cách phổ cập để phát tán kháng thuốc kháng sinh, độc lực, và những công dụng trao đổi chất thích ứng. [ 41 ] [ 89 ] Mặc dù chuyển gene ngang hiếm xảy ra ở sinh vật nhân thự, 1 số ít trường hợp tựa như đã được phát hiện ở bộ gene của sinh vật nguyên sinh và tảo chứa những gen có nguồn gốc từ vi trùng. [ 90 ] [ 91 ]
Bộ gene là toàn diện và tổng thể hàng loạt vật tư di truyền của một sinh vật và gồm có cả những gen và những trình tự không mã hóa. [ 92 ]
Số lượng gene[sửa|sửa mã nguồn]
Kích thước bộ gene, và số lượng gene mã hóa ở mỗi loài sinh vật là khác nhau. Virus, [ 100 ] và viroid ( mà hoạt động giải trí như thể một gen RNA không mã hóa ) có bộ gene nhỏ nhất. [ 101 ] trái lại, ở thực vật có những bộ gene cực kỳ lớn, [ 102 ] ví dụ điển hình ở cây lúa gạo chứa hơn 46.000 gene mã hóa protein. [ 103 ] Tổng số lượng gene mã hóa protein ( bộ protein, proteome, trên Trái Đất ) ước tính bằng 5 triệu trình tự. [ 104 ]
Mặc dù số lượng cặp base của DNA ở bộ gene người đã được biết đến từ thập niên 1960, ước tính số lượng gene có sự thay đổi theo thời gian khi định nghĩa về gene, và phương pháp xác định chúng liên tục được cập nhật và tinh chỉnh. Các dự đoán lý thuyết ban đầu về số lượng gene ở người cao tới mức 2.000.000 gene.[105] Trong khi các kết quả đo thực nghiệm sơ bộ ban đầu cho thấy số lượng này trong khoảng 50.000–100.000 gene được phiên mã (bằng phương pháp đánh dấu trình tự biểu hiện).[106] Sau đó, kết quả giải trình tự ở Dự án Bản đồ gene ở Người cho thấy nhiều trình tự được phiên mã là những biến thể khác của cùng một gen, và tổng số lượng gene mã hóa protein giảm xuống còn ~20.000[99] trong đó có 13 gene mã hóa nằm trong bộ gene ty thể.[97] Nghiên cứu sâu hơn từ dự án GENCODE, tiếp tục cho ước lượng số gene giảm xuống còn ~19.900.[107][108] Trong bộ gene ở người, chỉ 1–2% trong 3 tỷ cặp base DNA là đoạn mã hóa protein,[109][110] những đoạn còn lại là các DNA ‘không mã hóa’ bao gồm intron, retrotransposon, các trình tự điều hòa DNA và các đoạn DNA phiên mã thành RNA không mã hóa.[110][111] Trong mỗi tế bào ở sinh vật đa bào chứa toàn bộ gene nhưng không phải tất cả gene hoạt động trong từng tế bào.
Gene cơ bản[sửa|sửa mã nguồn]
Các gene cơ bản là tập hợp những gene được cho là trọng yếu đối với sự sinh tồn của một sinh vật.[113] Định nghĩa này dựa trên giả sử sinh vật được cung cấp nguồn chất dinh dưỡng đầy đủ và không chịu các áp lực từ môi trường nó sống. Chỉ một phần nhỏ gene của một sinh vật là gene cơ bản. Ở vi khuẩn, ước tính có khoảng 250–400 gene cơ bản đối với Escherichia coli và Bacillus subtilis, mà số lượng này nhỏ hơn 10% tổng số gene của chúng.[114][115][116] Một nửa các gen này là ortholog trong cả hai vi khuẩn và phần lớn tham gia vào sinh tổng hợp protein.[116] Ở nấm men Saccharomyces cerevisiae số lượng gene cơ bản cao hơn một chút, ở mức 1000 gene (~20% bộ gene của nó).[117] Mặc dù số lượng này càng khó xác định hơn ở sinh vật nhân thực bậc cao, ước tính ở chuột và người có khoảng 2000 gene cơ bản (~10% bộ gene).[118] Sinh vật tổng hợp, Syn 3, chứa 473 gene cơ bản và một số gene gần cơ bản (cần thiết cho sự sinh trưởng nhanh), mặc dù có 149 gene là chưa rõ chức năng.[112]
Các gene cơ bản gồm có gene giữ nhà ( housekeeping gene, chúng đặc biệt quan trọng quan trọng cho những công dụng cơ bản của tế bào ) [ 119 ] cũng như những gen được bộc lộ ở những thời gian khác nhau trong những quá trình tăng trưởng hoặc vòng đời sinh học. [ 120 ] Các gene giữ nhà được sử dụng trong trấn áp khoa học khi triển khai nghiên cứu và phân tích bộc lộ gen, vì chúng được biểu lộ cấu thành ở mức độ tương đối không đổi .
Định danh gene và bộ gene[sửa|sửa mã nguồn]
Định danh gene được quản trị bởi Ủy ban định danh gene ( HUGO ) cho mỗi gene đã biết ở người tuân theo dạng thức đã được phê chuẩn về tên của một gen và ký hiệu tương ứng của nó, được cho phép tài liệu về nó hoàn toàn có thể truy vấn được trải qua cơ sở tài liệu quản trị bởi Ủy ban này. Các ký hiệu được chọn duy nhất cho từng gene ( mặc dầu đôi lúc phê duyệt lại ký hiệu đổi khác ). Các ký hiệu được ưu tiên đặt sao cho giữ sự đồng điệu với những thành viên khác trong một mái ấm gia đình gene và với những gen tương đương ở những loài khác, đặc biệt quan trọng là ở chuột do nó được sử dụng là một trong những sinh vật quy mô. [ 121 ]
Kỹ thuật di truyền[sửa|sửa mã nguồn]
So sánh những giống cây cối thường thì với biến hóa di truyền transgenic và cisgenic .Kỹ thuật di truyền là những giải pháp chỉnh sửa bộ gene của một sinh vật nhờ những công nghệ sinh học. Từ thập niên 1970, nhiều kỹ thuật đã được tăng trưởng để thực thi thêm, vô hiệu hoặc sửa đổi những gen trong sinh vật. [ 122 ] Các kỹ thuật chỉnh sửa bộ gene được tăng trưởng gần đây sử dụng những enzyme nuclease để tạo ra những đích sửa chữa thay thế DNA trong nhiễm sắc thể hoặc là phá vỡ hay chỉnh sửa một gen khi vị trí đứt gãy được sửa đổi. [ 123 ] [ 124 ] [ 125 ] [ 126 ] Ngành sinh học tổng hợp ( synthetic biology ) đôi lúc sử dụng những kỹ thuật tương quan để lan rộng ra nghiên cứu và điều tra di truyền trên một sinh vật. [ 127 ]Kỹ thuật di truyền lúc bấy giờ là công cụ nghiên cứu và điều tra liên tục vận dụng cho những sinh vật quy mô. Ví dụ, hoàn toàn có thể thuận tiện thêm vào những gen ở vi trùng [ 128 ] và nòi giống ở chuột knockout với một công dụng gene đặc biệt quan trọng bị bất hoạt nhằm mục đích điều tra và nghiên cứu tính năng của những gen. [ 129 ] [ 130 ] Nhiều sinh vật đã được sửa đổi về mặt di truyền để ứng dụng trong nông nghiệp ( thực phẩm biến hóa gene ), công nghiệp công nghệ sinh học, và y học .Đối với sinh vật đa bào, đặc biệt quan trọng là những phôi được tác động ảnh hưởng theo ý muốn trước khi trưởng thành hay những sinh vật chỉnh sửa gen ( GMO ). [ 131 ] Tuy nhiên, bộ gene của những tế bào trong sinh vật trưởng thành hoàn toàn có thể chỉnh sửa bằng cách sử dụng những kỹ thuật liệu pháp gene để điều trị những bệnh tương quan tới di truyền .