Giáo trình Nucleic Acid - Hoàng Trọng Phấn

160 trang ngocly 4530

Download

Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Nucleic Acid - Hoàng Trọng Phấn", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_nucleic_acid_hoang_trong_phan.pdf

Nội dung text: Giáo trình Nucleic Acid - Hoàng Trọng Phấn

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC HUẾ HỒNG TRỌNG PHÁN (Chủ biên) - ĐỖ QUÝ HAI Giáo trình NUCLEIC ACID Huế - 2005
3 Lời nĩi đầu Kể từ lúc Oswald T. Avery, MacLeod và McCarty (Đại học Standford, USA; 1944) chứng minh DNA là vật chất mang thơng tin di truyền và đặc biệt là, từ ngày James Watson và Francis Crick khám phá ra cấu trúc phân tử DNA - 25/4/1953 đến nay, Hố sinh học và Sinh học phân tử đã phát triển với một tốc độ hết sức nhanh chĩng. Những thành tựu mới nối tiếp nhau ra đời, đáng kể là sự hồn thành việc giải mã di truyền bởi hai nhĩm nghiên cứu của Marshall Nirenberg và Gobind Khorana vào tháng 6 năm 1966 và sự ra đời của Kỹ thuật Di truyền vào giữa thập niên 1970 là hai sự kiện nổi bật nhất kể từ sau khi sinh học phân tử ra đời. Kế đĩ, sự thành cơng của Dự án Bộ gene Người (Human Genome Project = HGP) vào tháng 4 năm 2003 được xem là một trong những kỳ cơng thám hiểm vĩ đại nhất của lồi người. Lần đầu tiên con người cĩ thể đọc được một cách đầy đủ tồn bộ trình tự 3.164.700.000 cặp base trong bộ gene của mình. Tất cả những sự kiện nổi bật này minh chứng một điều rằng: Sự phát triển cùng với những thành tựu đạt được của lĩnh vực nghiên cứu nucleic acid và sinh học phân tử nĩi chung trong thời gian qua quả là vơ cùng to lớn! Để gĩp phần đổi mới nội dung giáo trình Nucleic Acid theo hướng cập nhật kiến thức cũng như phương pháp dạy và học bộ mơn, chúng tơi đã tham cứu nhiều tài liệu khác nhau và cố gắng biên soạn giáo trình trên tinh thần ấy. Chúng tơi hy vọng rằng giáo trình này sẽ đáp ứng được phần nào nhu cầu học tập của sinh viên trong bối cảnh đổi mới giáo dục hiện nay. Nội dung giáo trình gồm sáu chương bao quát các kiến thức cơ bản về nucleic acid. Chương 1 đề cập đến Lịch sử và phương pháp nghiên cứu nucleic acid; các chương 2, 3 và 4 tập trung chủ yếu vào các khía cạnh cấu trúc của các nucleotide, polynucleotide, các phân tử DNA và RNA; cịn các chương 5 và 6 đi sâu vào cơ chế của các quá trình sinh tổng hợp nucleotide, DNA, RNA và protein. Mặt khác, để đảm bảo tính tồn diện và tính hệ thống của giáo trình (trong khuơn khổ đã định), các kiến thức đại cương về cơ sở phân tử của đột biến và tái tổ hợp DNA cũng được trình bày ở cuối chương 5 như là mặt biến đổi thiết yếu, mang tính biện chứng của cấu trúc di truyền này. Cuối mỗi chương đều cĩ các phần Câu hỏi và Bài tập và Tài liệu tham khảo để bạn đọc tiện ơn tập và tra cứu. Giáo trình Nucleic Acid này được ra đời trong khuơn khổ của Dự án Giáo dục Đại học Huế. Vì vậy một số kiến thức nâng cao như phần Cơng
4 nghệ DNA tái tổ hợp - một lĩnh vực ứng dụng mới mẻ và rộng lớn của sinh học phân tử - theo quy định sẽ được đề cập trong một giáo trình riêng - Cơng nghệ DNA tái tổ hợp - mà khơng đi sâu với tư cách là một chủ đề hay một chương riêng. Bên cạnh đĩ, một số thuật ngữ khoa học được thống nhất sử dụng bằng tiếng Anh để giúp người học dễ dàng hơn trong việc tiếp cận với thơng tin qua sách báo nước ngồi hoặc internet. Giáo trình này do ThS. Hồng Trọng Phán và PGS.TS. Đỗ Quý Hai - hiện đang cơng tác tại Khoa Sinh học các trường Đại học Sư phạm và Đại học Khoa học thuộc Đại học Huế - biên soạn, với sự phân cơng như sau: ThS. Hồng Trọng Phán chủ biên và biên soạn các chương 3, 4, 5, 6 và một phần của chương 2; và PGS.TS. Đỗ Quý Hai biên soạn chương 1 và một phần của chương 2. Để giáo trình này kịp thời ra mắt bạn đọc, chúng tơi xin trân trọng cảm ơn Dự án Giáo dục Đại học Huế đã tài trợ cho việc biên soạn và xuất bản giáo trình trong khuơn khổ của Dự án Giáo dục Đại học mức B. Chúng tơi xin bày tỏ lịng cảm ơn đặc biệt đến GS. TSKH. Lê Dỗn Diên, Chủ tịch Hội Hố sinh Việt Nam, Giám đốc Trung tâm INCEDA đã dày cơng đọc bản thảo và cho nhiều ý kiến quý báu kể từ khi đề cương giáo trình bắt đầu được hình thành. Do khả năng cịn hạn chế, chắc chắn giáo trình cịn nhiều thiếu sĩt. Chúng tơi rất mong nhận được sự phê bình và chỉ bảo của các đồng nghiệp và bạn đọc để giáo trình được hồn chỉnh hơn trong lần in sau. Huế, ngày 15 tháng 10 năm 2005 Các tác giả, HỒNG TRỌNG PHÁN - ĐỖ QUÝ HAI
5 Mục lục Lời nĩi đầu 3 Chương 1: Lịch sử và Phương pháp Nghiên cứu Nucleic Acid Đỗ Quý Hai 7 I. Lịch sử nghiên cứu 7 II. Các phương pháp nghiên cứu 11 1. Các phương pháp chung 12 2. Các phương pháp tách chiết nucleic acid 14 3. Các phương pháp phân tích định tính và định lượng thơ nucleic acid 17 4. Các phương pháp xác định trình tự nucleic acid 19 Chương 2: Cấu trúc của các Nucleotide và Polynucleotide Hồng Trọng Phán - Đỗ Quý Hai 21 I. Thành phần hố học của các nucleotide 21 1. Base nitơ 21 2. Đường pentose 24 3. Phosphoric acid 25 II. Cấu trúc của các nucleotide 25 1. Cấu trúc của các nucleoside 25 2. Cấu trúc của các nucleotide 26 3. Cấu trúc của các di- và triphosphate nucleoside 27 III. Cấu trúc của các chuỗi polynucleotide 29 Chương 3: Cấu trúc và Đặc điểm của DNA Hồng Trọng Phán 33 I. Thành phần hố học của DNA 33 II. Cấu trúc chuỗi xoắn kép DNA 34 1. Mơ hình Watson-Crick 35 2. Các dạng DNA xoắn phải và xoắn trái 38 3. Các DNA mạch vịng sợi kép và sợi đơn 40 III. Định khu, hàm lượng và kích thước của DNA 43 IV. Đặc tính hố lý của DNA 49 V. Chức năng của DNA 56
6 Chương 4: Cấu trúc và Chức năng của các RNA Hồng Trọng Phán 61 I. Cấu trúc và chức năng của các mRNA 63 II. Cấu trúc và chức năng của các tRNA 69 III. Cấu trúc và chức năng của các rRNA 71 Chương 5: Sinh tổng hợp Nucleotide và DNA Hồng Trọng Phán 75 I. Sinh tổng hợp các nucleotide 75 1. Sinh tổng hợp các nucleotide purine 75 2. Sinh tổng hợp các nucleotide pyrimidine 77 II. Sinh tổng hợp DNA (Tái bản) 79 1. Những nguyên tắc và đặc điểm chung của tái bản DNA 80 2. Các enzyme tham gia tái bản DNA 82 3. Cơ chế tái bản DNA 84 4. Tái bản của các bộ gene RNA 91 5. Ứng dụng của enzyme tái bản trong kỹ thuật sinh học phân tử 93 III. Cơ sở phân tử của đột biến và tái tổ hợp DNA 97 1. Cơ sở phân tử của đột biến 97 2. Sửa chữa DNA 105 3. Tái tổ hợp và đại cương về cơng nghệ DNA tái tổ hợp 107 Chương 6: Sinh tổng hợp RNA và Protein Hồng Trọng Phán 117 I. Sinh tổng hợp RNA (Phiên mã ) 117 1. Đặc điểm chung của phiên mã 117 2. Các RNA polymerase ở prokaryote và eukaryote 118 3. Cơ chế phiên mã ở prokaryote và eukaryote 119 II. Cấu trúc và chức năng của protein 128 1. Cấu trúc của protein 128 2. Chức năng của protein 130 III. Mã di truyền 132 IV. Cơ chế của quá trình sinh tổng hợp protein (Dịch mã) 136 1. Hoạt hố amino acid 136 2. Mở đầu, kéo dài và kết thúc sự tổng hợp chuỗi polypeptide 137 V. Sự điều hồ sinh tổng hợp protein ở vi khuẩn 141 1. Mơ hình operon ở E. coli 141 2. Operon lactose và cơ chế điều hồ cảm ứng - âm tính 143
7 3. Operon tryptophan và cơ chế điều hồ ức chế - âm tính 145
7 Chương 1 Lịch sử và Phương pháp Nghiên cứu Nucleic Acid I. Lịch sử nghiên cứu Nucleic acid là những hợp chất cao phân tử đĩng vai trị hết sức quan trọng trong hoạt động sống của mọi cơ thể sinh vật. Chúng tham gia vào các quá trình cơ bản của sự sống như sinh tổng hợp protein, sinh trưởng, sinh sản và di truyền. Trong một thời gian dài các nhà hĩa học và các nhà nghiên cứu về sinh lý dinh dưỡng đã coi protein, lipid và carbonhydrate là ba chất quan trọng nhất tạo nên cơ thể sống. Quan điểm cho rằng nucleic acid là những cấu tử trơ của nhân và tế bào chất đã mãi mãi lãng quên từ khi chất thứ tư này – nucleic acid được chứng minh là chất quan trọng hơn so với các chất trước đĩ. Năm 1869, lần đầu tiên nhà hĩa sinh học trẻ tuổi người Thụy Sĩ Friedrich Miescher (1844 -1895) đã phát hiện nucleic acid trong nhân tế bào. Ơng đã đặt tên là nuclein vì nhận thấy nĩ tồn tại ở trong nhân tế bào (nucleus). Đối tượng nghiên cứu của Miescher là những bạch cầu (lymphocytes). Khi dùng acid kết tủa dịch chiết xuất từ nhân của tế bào mủ lấy từ bơng băng bỏ đi (bằng cách dùng enzyme phân hủy protein của dịch dạ dày là pepsin để tiêu hĩa các phần khác giàu protein của tế bào) ơng đã vơ cùng ngạc nhiên nhận thấy rằng, nhân tế bào chứa một chất khơng phải mỡ, khơng phải carbonhydrate, cũng khơng phải protein. Nĩ cũng khơng giống một chất sống nào đã biết và chứa phosphor và nitơ, hịa tan thì cho tính acid. Từ “nucleic acid” là do Altman đề nghị năm 1889 (ơng đã phát hiện ra rằng đối tượng thuận tiện tốt nhất để chiết rút chất nuclein là những đầu tinh trùng của cá hồi). Và thực chất mỗi đầu tinh trùng của cá hồi hồn tồn tương ứng với một nhân tế bào. Để điều chế chế phẩm nucleic acid, Miescher đã hịa tan phần đầu của tinh trùng (tế bào sinh dục đực) trong dung dịch muối nồng độ cao, sau đĩ bằng cách thêm nước vào đã gây ra kết tủa nucleic acid ở dạng sợi. Cần phải giữ chế phẩm lạnh do đĩ trong các ngày đơng tháng giá của mùa đơng, ơng đã làm việc trong phịng khơng sưởi. Thực tế, lịch sử nghiên cứu hĩa học của nucleic acid gắn liền
8 với tên tuổi của Felix Hoppe - Seiler (1825-1895), nhà sinh lý học và hố học rất nổi tiếng người Đức vì chính ở phịng thí nghiệm của ơng ở Tübingen. Miescher đã làm việc với danh nghĩa là người học trị và cộng tác viên khoa học trẻ. Mặc dù Miescher là một cộng tác viên vơ cùng cẩn thận và đầy triển vọng song Hoppe - Seiler vẫn thấy cần thiết phải đích thân lặp lại thí nghiệm xem cĩ đúng là một chất mới hay khơng. Kết quả thực nghiệm khơng những khẳng định thành tựu của Miescher mà cịn thu được thêm nhiều dẫn liệu mới rất đặc trưng. Hoppe - Seiler cịn phát hiện trong nhân tế bào nấm men cũng cĩ chất nuclein giống như ở tế bào bạch cầu. Người kế tục phát triển cơng trình của Miescher là nhà hĩa sinh học (hĩa học hữu cơ) người Đức Albrecht Kossel (1853 - 1927). Năm 1882, ơng đã phân tích nucleic acid ra những phần nhỏ chứa acid phosphoric, đường và base chứa nitơ (Kossel đã tách được hai pyrimidine và đặt tên là cytosine và thymine, cũng như hai purine với tên adenine và guanine). Do cơng trình này ơng đã đạt giải Nobel về y và sinh lý học vào năm 1910. Một pyrimidine khác là uracil cũng đã được phát hiện sau này. Trong những năm đầu của thế kỷ XX (1900 - 1932), nhà hĩa sinh học người Mỹ gốc Nga Phoebus Aaron Theodore Levene (1869 - 1940) đã xác định được đơn vị cấu tạo của nucleic acid là các nucleotide (hay mononucleotide) và phân biệt được hai loại nucleic acid: deoxyribonucleic acid (DNA) và ribonucleic acid (RNA). Như vậy, cho đến năm 30 của thế kỷ XX này, người ta đã biết được thành phần của các nucleic acid. Levene đã đốn trước 4 nucleotide khác nhau liên quan đến RNA là adenylic acid (chứa adenine), guanilic acid (chứa guanine), cytidilic acid (chứa cytosine) và uridic acid (chứa uracil). Ơng cũng giả thiết 4 nucleotide tiếp theo liên quan đến DNA là deoxyadenilic acid, deoxyguanilic acid, deoxythymidilic acid (chứa thymidine) và deoxycytidilic acid (chứa cytosine). Do các giả thiết này của Levene tỏ ra phù hợp với hiểu biết của hĩa học cho nên chúng sớm được các nhà hĩa học chấp nhận. Nhưng cho đến thời kỳ đầu những năm 1950, chúng vẫn chưa được chứng minh rõ ràng khi nhà hĩa sinh học người Anh Alexander Robertus Todd (1907-1997) chưa tổng hợp được các nucleotide phù hợp một cách chính xác với các cơng thức của Levene. Todd đã xác nhận được rằng các chất này thực tế giống
9 các hợp chất đã thu nhận được từ nucleic acid. Với cơng trình này, Todd đã được trao giải thưởng Nobel về hĩa học năm 1957. Trong những năm 1949 - 1953 nhà sinh học người Mỹ gốc Áo Erwin Chargaff (1905 - 2002) khi phân tích DNA đã phát hiện sự cân bằng của các base trong DNA: số nhĩm purine bằng số nhĩm pyrimidine (purine/pyrimidine = 1), số nhĩm adenine bằng số nhĩm thymine (adenine/thymine = 1), số nhĩm guanine bằng số nhĩm cytosine (guanine/cytosine = 1). Về sau này người ta đã đặt quy tắc mang tên ơng về tổng lượng các loại nucleotide cấu tạo nên các DNA. Trong những năm đầu thập niên 1950, hai nhà vật lý học người Anh, Maurice Hugh Frederick Wilkins (1916 - 2004) cùng với Rosalind Franklin (1920 - 1958) bắt đầu tiến hành các nghiên cứu đầu tiên về cấu trúc DNA. Wilkins là con trai của một bác sĩ người New Zealand chuyên học vật lý và vào thời kỳ đầu cuộc Chiến tranh Thế giới thứ hai, ơng làm việc cho sự phát triển bom nguyên tử. Nhưng sau cuộc Thế chiến này, ơng dùng tất cả sức lực của mình cho cơng việc nghiên cứu DNA và đã trở thành một trong những nhà bác học tiên phong trong lĩnh vực này nên được coi là nhà lý sinh học. Wilkins và Franklin đã áp dụng phương pháp nhiễu xạ Rơnghen (X-ray diffraction) vào việc nghiên cứu cấu trúc tinh thể của DNA (lấy từ tuyến ức bê, thymus). Với những bức ảnh chụp cấu trúc tinh thể DNA cĩ dạng chữ thập, hai tác giả này gợi ý rằng DNA cĩ thể gồm hai hoặc ba mạch đơn bện xoắn với nhau. Năm 1953, từ các nghiên cứu của mình kết hợp với các kết quả nghiên cứu trước đĩ của Chargaff và Wilkins, hai nhà khoa học ở trường Đại học Tổng hợp Cambridge là Francis Harry Compton Crick (England; 1916-2004) và James Dewey Watson (USA; 1928-2003) đã xây dựng thành cơng mơ hình chuỗi xoắn kép của phân tử DNA. Với cơng trình này, Watson và Crick đã được trao giải thưởng Nobel về y học và sinh lý học năm 1962. Từ đĩ Crick đã xây dựng một chuỗi xoắn kép DNA bằng đồng trong vườn nhà ơng ở trung tâm Cambridge, sau đĩ đã viết: “Người ta hỏi tơi là khi nào thì sẽ mạ vàng”. Cùng với việc nghiên cứu cấu trúc DNA, các nhà khoa học cũng đã nỗ lực tìm hiểu vai trị và các chức năng sinh học của nĩ. Vào năm 1944, nghĩa là sau 75 năm kể từ khi phát hiện DNA trong nhân tế bào năm 1869, nhà vi khuẩn học người Mỹ Oswwald Theodore Avery (1877 - 1955) đã chứng minh DNA là chất liệu di
10 truyền khi bổ sung DNA chiết xuất từ chủng độc (chủng khơng độc của phế cầu khuẩn Diplococcus pneumoniae biến thành chủng độc gây viêm phổi và làm chết chuột bắt nguồn từ thí nghiệm biến nạp của F. Grifith năm 1928) vào mơi trường nuơi cấy và kết hợp với việc xử lý bằng DNase. Điều đĩ chứng tỏ DNA quyết định tính chất di truyền của phế cầu khuẩn. Năm 1952, Alfred Day Hershey (1908 - 1997) và Martha Chase (1927 - 2003) cho biết, bằng đồng vị phĩng xạ cĩ thể theo dõi sự di chuyển của protein và DNA của virus (cơ sở là DNA chứa phosphor, protein chứa lưu huỳnh mà khơng chứa phosphor; vì vậy DNA virus cĩ thể được đánh dấu bằng đồng vị phĩng xạ phosphor, cịn protein virus được đánh dấu bằng đồng vị phĩng xạ lưu huỳnh). Khi đánh dấu một số hạt virus ở phần protein và một số hạt virus ở phần DNA rồi đưa vào mơi trường nuơi cấy vi khuẩn chủ E. coli thì thấy DNA virus nhanh chĩng thâm nhập vào tế bào chủ, cịn phần protein thì khơng. Thí nghiệm cũng đã chứng minh tầm quan trọng về mặt di truyền của DNA. Năm 1955, nhà hĩa sinh học Mỹ Fraenkel-Konrad (1910 - ) đã chia virus ra làm hai phần và sau đĩ nối được hai phần đĩ lại, phần protein khơng gây nhiễm (khơng chui vào tế bào vật chủ) cịn phần DNA thì gây nhiễm. Thí nghiệm của Krauss trên hồng cầu người chứng minh sự liên quan giữa cấu trúc hĩa học của protein với vai trị di truyền của DNA (khi đưa DNA chiết xuất từ hồng cầu non của người lành vào tủy xương bệnh nhân thiếu máu hình lưõi liềm (cĩ HbS khơng bình thường) thì thấy hemoglobin bình thường được tổng hợp. Điều đĩ chứng tỏ DNA quyết định cấu trúc đặc hiệu của protein. Các thí nghiệm sau đĩ của các nhà khoa học đã chú trọng vào việc tổng hợp DNA. Năm 1956 Severo Ochoa (1905 - 1993) và Arthur Kornberg (1918 - ) - hai nhà khoa học người Mỹ đã tổng hợp DNA in vitro bằng cách trộn enzyme DNA polymerase I được chiết xuất từ E. coli với các dNTP, DNA khuơn (DNA tự nhiên) và Mg++, DNA thu được khơng khác DNA tự nhiên. Hai nhà khoa học này đã được nhận giải thưởng Nobel về y học và sinh lý học vào năm 1959. Năm năm sau khi cơng bố cơng trình cấu trúc xoắn kép của DNA vào năm 1958, Matthew Stanley Meselson (1930 - ) và Franklin William Stahl (1928 - ) đã chứng minh bằng thực nghiệm dự đốn trên là hồn tồn cĩ cơ sở. Bằng cách nuơi vi khuẩn E.
11 coli ở mơi trường chứa nitơ nặng 15N sau đĩ bằng 14N bình thường rồi theo dõi qua các thế hệ, xem sự thay đổi tỷ trọng của DNA qua máy ly tâm siêu tốc (siêu ly tâm); hai nhà khoa học đã xác định được cơ chế tái sinh bán bảo tồn của DNA. Về việc nghiên cứu RNA, cho đến cuối những năm 30 của thế kỷ XX, các nhà khoa học vẫn nghĩ rằng DNA là đặc trưng của các tế bào động vật, cịn RNA chỉ cĩ thể gặp được ở trong nấm men và các tế bào thực vật. Nguồn quan trọng nhất của DNA lúc này là tuyến ức (thymus), cịn đối với RNA là nấm men. Các nghiên cứu chính xác hơn sau này đã cho thấy cả hai loại nucleic acid đều cĩ mặt trong tất cả các tế bào động vật và thực vật. Năm 1939, các nhà nghiên cứu Torbjorn Oskar Caspersson (Thụy điển; 1910 - 1997) và Jean Brachet (Bỉ; 1909 - 1998) đã chứng minh sự tổng hợp mạnh mẽ protein trong bào tương cùng xảy ra với sự tổng hợp manh mẽ RNA. Năm 1956, S. Ochoa (nhà hĩa sinh học người Mỹ) đã dùng enzyme RNA polymerase được chiết xuất từ vi khuẩn Azobacter vineladni để tổng hợp RNA in vitro. Năm 1956, George Emile Palade (1912 - ) đã chứng minh microsome cĩ chứa những hạt cĩ nhiều RNA gọi là thể ribo tức là ribosome (55% RNA, cịn lại là protein). Năm 1961, Francois Jacob (1920 - ) và Jacques Lucien Monod (1910 - 1976) nêu vấn đề cĩ một loại RNA khác cĩ đặc điểm chuyển hĩa nhanh chĩng và cĩ cấu tạo tương tự DNA. Đĩ là mRNA, là chất trung gian chuyển thơng tin từ DNA đến chuỗi polypeptide được tổng hợp. Trước đĩ vào năm 1958, M. B. Hoagland (nhà hĩa sinh học người Mỹ) đã nghiên cứu vấn đề đưa amino acid vào ribosome. Ơng đã xác định là trước khi tham gia tổng hợp protein, amino acid được kết hợp với RNA vận chuyển (tRNA) để vận chuyển amino acid từ bào tương vào ribosome. Với những phương pháp thí nghiệm khác nhau các phịng thí nghiệm của Marshall Warren Nirenberg (1927 - ), Har Gobind Khorana (1922 - ) và Ochoa đã xác định được các bộ ba mật mã của tồn bộ 20 amino acid vào những năm 1961 - 1965. Do vai trị quan trọng của nucleic acid trong hoạt động sống của cơ thể sinh vật (tham gia vào các quá trình cơ bản của sự sống
12 như sinh tổng hợp protein, sinh trưởng, sinh sản và di truyền), cho nên việc nghiên cứu nucleic acid ngày càng được chú trọng. Từ những năm 70 của thế kỷ XX trở lại đây, nhất là trong 10 năm cuối của thế kỷ và những năm đầu của thế kỷ XXI này, hiểu biết về nucleic acid ngày càng được mở rộng. Nhờ những thành tựu của sinh học phân tử, một lĩnh vực khoa học mới đã hình thành và phát triển mạnh mẽ, đĩ là cơng nghệ gen, một trọng tâm được đầu tư nghiên cứu hàng đầu của cơng nghệ sinh học. II. Các phương pháp nghiên cứu Cũng như sự nghiên cứu các đại phân tử sinh học khác, cĩ nhiều phương pháp và kỹ thuật được sử dụng trong việc nghiên cứu nucleic acid. Tuy nucleic acid cĩ cấu trúc phức tạp và hoạt động rất chặt chẽ, nhưng nhờ những thành tựu mới về kỹ thuật, đã ra đời nhiều phương tiện và phương pháp nghiên cứu hiện đại, đảm bảo độ chính xác cao, cho phép khám phá thêm nhiều điều quan trọng ở nucleic acid. 1. Các phương pháp chung 1.1. Phương pháp nhiễu xạ Rơnghen Phương pháp này dựa trên sự tán xạ của tia X (tia Rơnghen) qua cấu trúc tinh thể của chất cần phân tích. Bằng cách đĩ và pha của tia X bị nhiễu xạ kết hợp với việc xử lý dữ liệu trên máy tính, người ta cĩ thể xác định được chính xác vị trí của một nguyên tử bất kỳ so với các nguyên tử cịn lại trong một đại phân tử. Nhờ vậy, người ta cĩ thể thu nhận được một hình ảnh "tĩnh" về cấu trúc phân tử nằm ở trạng thái tinh thể. Tuy nhiên, cần chú ý rằng các chất nằm trong tế bào khơng bao giờ tồn tại ở trạng thái tinh thể, mà chúng thường nằm ở trạng thái hồ tan hoặc kết hợp với các cấu trúc khác của tế bào. Bởi vậy, người ta thường sử dụng thêm phương pháp phân tích cộng hưởng từ hạt nhân để thu được cấu trúc phân tử của chất cần phân tích ở trạng thái hoạt động sinh học. Nhờ kết quả nhiễu xạ Rơnghen trên các sợi nucleic acid, người ta đã xác định được cấu trúc khơng gian của phân tử nucleic acid (chủ yếu là của DNA). 1.2. Phương pháp điện di
13 Nguyên tắc của phương pháp này là dựa vào tính phân cực của phân tử và khả năng di chuyển về một hướng xác định khi chịu tác động của một điện trường. Trong các dung dịch kiềm và trung tính, các đại phân tử nucleic acid tích điện âm đồng đều trên khắp bề mặt nên trong điện trường, chúng sẽ di chuyển về cực dương của điện trường. Bằng phương pháp điện di, chúng ta cĩ thể thu được nucleic acid dạng tinh khiết từ dịch chiết nghiên cứu. Phương pháp này cũng được dùng để tách riêng các nucleic acid DNA, RNA, cũng như các loại RNA riêng biệt (mRNA, rRNA, tRNA). 1.3. Phương pháp sắc ký Phương pháp sắc ký dựa vào khả năng phân bố của các chất chạy sắc ký khi đưa vào dung mơi kết hợp với khả năng hấp phụ của vật liệu sắc ký. Các chất khác nhau cĩ khả năng hịa tan vào dung mơi khác nhau và được vật liệu sắc ký hấp phụ với lực khác nhau cho nên tốc độ di chuyển của chúng trên sắc ký đồ là khác nhau. Do đĩ các chất này sẽ được tách ra trong quá trình chạy sắc ký. Phương pháp này được dùng để tách chiết và tinh chế nucleic acid. Cĩ nhiều phương pháp sắc ký: sắc ký giấy, sắc ký cột, sắc ký trao đổi ion, sắc ký lớp mỏng, sắc ký khí. 1.4. Phương pháp quang phổ Nguyên tắc của phương pháp này là dựa vào sự hấp thụ mạnh ánh sáng của một chất ở một bước sĩng xác định. Nucleic acid hấp thụ mạnh ánh sáng tử ngoại ở bước sĩng 260 nm do sự cĩ mặt của base purine và pyrimidine. Giá trị mật độ quang ở bước sĩng 260nm (OD260nm) của các mẫu cho phép xác định nồng độ nucleic acid trong mẫu. Người ta cũng xác định được độ tinh khiết của chế phẩm nucleic acid khi xác định độ hấp thụ ánh sáng ở 280 và 260 nm (độ hấp thụ cực đại của protein là ở 280 nm). 1.5. Phương pháp đồng vị phĩng xạ Nguyên tắc của phương pháp này là các chất đồng vị phĩng xạ được gắn lên chất nghiên cứu và dùng kỹ thuật phĩng xạ tự ghi để theo dõi quá trình biến đổi của các chất khi đưa chúng vào cơ thể hoặc mơi trường cần nghiên cứu. Nhờ vậy cĩ thể xác định được cơ chế tham gia quá trình biến đổi của chất cần nghiên cứu. Cũng cĩ thể dùng máy đo phĩng xạ để định lượng chất cần nghiên cứu.
14 Phương pháp đồng vị phĩng xạ được dùng để nghiên cứu cơ chế tổng hợp nucleic acid. Ngồi ra việc xác định thành phần cấu trúc cũng như định lượng nucleic acid cũng được tiến hành bằng phương pháp này. Các đồng vị hay dùng cho các nghiên cứu này là: 3H, 14C, 32P, 15N. 1.6. Phương pháp hĩa học Dùng phương pháp thủy phân thích hợp bằng acid hay kiềm, người ta cĩ thể thu nhận được các phần khác nhau của nucleic acid. Bằng cách kết hợp với các phương pháp khác như sắc ký hay điện di, các thành phần được tách riêng để nghiên cứu cấu trúc, thành phần hĩa học và tính chất của chúng. Người ta cũng cĩ thể dùng phương pháp hĩa học để định tính nucleic acid trong tế bào nhờ những phản ứng hĩa học đặc trưng. 1.7. Phương pháp dùng hệ thống vơ bào Người ta cĩ thể sử dụng đối tượng nghiên cứu là cơ thể tồn vẹn, lát cắt mơ, tế bào, nhưng một phương pháp nghiên cứu rất cĩ hiệu quả là phương pháp dùng các hệ thống vơ bào (khơng dùng tế bào nguyên vẹn). Nghiền vỡ tế bào rồi dùng các phương pháp ly tâm để tách các thành phần khác nhau của tế bào. Dựa trên nhu cầu nghiên cứu, người ta cĩ thể thêm vào hệ thống vơ bào các chất khác nhau. Nhờ hệ thống vơ bào này chúng ta cĩ thể nghiên cứu quá trình sinh tổng hợp protein, vai trị của các nucleic acid trong quá trình này, cũng như bản thân quá trình tổng hợp các nucleic acid. P. C. Zamecnik và cộng sự lần đầu tiên phát triển các hệ thống vơ bào để nghiên cứu sinh tổng hợp protein, đã xác định các hạt ribonucleoprotein (ribosome) là nơi sinh tổng hợp protein và đã phát hiện ra tRNA. 2. Các phương pháp tách chiết nucleic acid Để đảm bảo cho các nghiên cứu tiếp theo, nucleic acid cần được tách với một lượng đủ lớn và đủ tinh sạch. Chính vì vậy điều cần chú ý trước hết là phải thu nhận các nucleic acid ở trạng thái nguyên vẹn, khơng bị phân hủy bởi các tác nhân cơ học hay hĩa học. Việc nghiền lắc mạnh khơng đúng quy trình cũng dễ làm tổn thương đến phân tử nucleic acid (dễ bị gãy). Các enzyme nội bào bị phá vỡ cũng cĩ thể thủy phân nucleic acid. Để ức chế hoạt động của các enzyme nội bào (deoxyribonuclease
15 = DNase, và ribonuclease = RNase) cần tách chiết nucleic acid ở nhiệt độ thấp, hoặc sử dụng các chất ức chế sự hoạt động của các enzyme này. 2.1. Phương pháp tách chiết DNA DNA là phân tử cĩ kích thước lớn nên cần tránh các tác nhân cĩ học hoặc hĩa học mạnh, tránh làm đứt gãy. Cĩ nhiều phương pháp khác nhau được sử dụng để tách chiết DNA, như: ly tâm gradient tỷ trọng ClCs, cột sắc ký trao đổi anion (Kit QIAGEN), v.v. Dưới đây chỉ là một trong các phương pháp tách chiết DNA đĩ. Phương pháp tách chiết này gồm 3 bước cơ bản sau: - Bước 1: Phá vỡ màng tế bào và màng nhân (ở tế bào eukaryote) bằng hỗn hợp chất tẩy (SDS - sodium dodecyl sulfate, sarcosyl) và proteinase. Các DNA sẽ được giải phĩng ra mơi trường. Các protein liên kết với DNA cũng tự bị phân hủy. - Bước 2: Loại bỏ thành phần khơng mong muốn trong mẫu mà chủ yếu là protein bằng dung dịch: phenol chloroform. Dung dịch này làm biến tính protein và khơng hịa tan nucleic acid. Sau khi ly tâm loại protein (nằm giữa pha nước và pha phenol: chloroform) sẽ thu được nucleic acid (ở pha nước). - Bước 3: Kết tủa nucleic acid. Mục đích là thu nhận nucleic acid dưới dạng cơ đặc và bảo vệ chúng khỏi sự phân hủy của các enzyme cũng như cĩ thể hịa tan trở lại theo nồng độ mong muốn. + Dùng etanol nồng độ cao (2,5 dung tích ethanol/1 dung tích mẫu) trong mơi trường cĩ lực ion cao (nồng độ muối cao), ở nhiệt độ thấp. Hầu như tồn bộ nucleic acid đều kết tủa trong điều kiện này. + Dùng isopropanol (thể tích dung mơi: thể tích mẫu là 1:1), khơng cĩ sự hiện diện của muối. Các DNA trọng lượng phân tử thấp khơng bị kết tủa, do đĩ cĩ thể loại chúng ra khỏi dịch chiết bằng cách này. Tủa thu được bằng 2 cách trên được thu nhận lại bằng cách ly tâm. Sau đĩ được rửa lại bằng ethanol 70% để loại bỏ các muối và các dấu vết isopropanol. Và cuối cùng là, tiến hành xử lý bằng RNase để loại bỏ RNA. 2.2. Phương pháp tách chiết RNA tồn phần và mRNA Các loại RNA đềulà các phân tử khơng bền, dễ bị phân hủy bởi
16 các enzyme ribonuclease (RNase). Hoạt tính của các enzyme này rất cao và bền vững với các tác nhân thường dùng để bất hoạt enzyme (như xử lý 900C trong 1h khơng làm mất hoạt tính nĩ). RNase lại cĩ mặt khắp nơi (ví dụ trên đầu ngĩn tay của người thao tác ). Chính vì vậy, cần phải cĩ nhiều biện pháp thận trọng để tránh các tạp nhiễm bởi các RNase từ mơi trường: thao tác trong điều kiện vơ trùng, mọi dụng cụ hĩa chất đều được khử trùng bằng nhiệt hay được xử lý với DEPC hầu tránh mọi tiếp xúc với dụng cụ bằng tay trần. - Việc tách chiết RNA tồn phần cũng gồm 3 bước cơ bản như đối với DNA: (Lưu ý rằng, đây cũng chỉ là một trong các phương pháp được sử dụng mà thơi. Hiện nay phương pháp được sử dụng phổ biến nhất để chiết tách RNA là Tri201.) + Nghiền tế bào mơ trong dung dịch cĩ một một chất tẩy mạnh (SDS, sarcosyl) ở nồng độ cao, một tác nhân gây biến tính protein mạnh (guamidium thiocyanate), một chất khử (2 - mercaptoethanol). Các chất này cĩ tác dụng ức chế hoạt động của các RNase nội bào và tách các protein liên kết khỏi phân tử RNA. + Loại protein bằng xử lý phenol: chloroform và ly tâm. + RNA được kết tủa bằng ethanol và thu lại bằng ly tâm. Dưới dạng kết tủa trong etanol hoặc đơng lạnh ở -700C trong nước cĩ chứa chất ức chế RNase là R - nasine, RNA cĩ thể được bảo quản trên một năm. Và, cuối cùng là bước tách RNA khỏi DNA. - Tách chiết mRNA (ở các tế bào nhân chuẩn) Khoảng 90-99% tổng số RNA tế bào là rRNA (80 - 85%), tRNA(15 - 20%), snRNA (<1%). Chúng cĩ kích thước và trình tự xác định và cĩ thể được tách riêng bằng điện di, ly tâm mRNA chiếm khoảng 1 - 5% tổng số RNA tế bào. Kích thước và trình tự của loại này vơ cùng đa dạng. Tuy vậy, chúng cĩ một đặc điểm chung là cĩ cấu trúc đuơi polyA (cĩ thể lên đến 100A). Người ta cĩ thể tách mRNA ra khỏi mẫu bằng cách dựa vào cấu trúc trên và đặc tính liên kết bổ sung A-T của nucleic acid, sử dụng sắc ký ái lực trên cột oligodT - cellulose. Các bộ mẫu thử (các kit) được xuất hiện trên thương trường hiện nay sử dụng các viên bi từ cĩ mang oligodT trên bề mặt là dựa vào nguyên tắc đã nêu trên. Rằng liên kết bỏ sung với oligodT, sau khi các mRNA bám lên bề mặt các viên bi từ, chúng sẽ được thu nhận lại qua ly tâm hoặc sử dụng nam châm và mRNA sẽ được tách khỏi các viên bi và giữ lại. Bằng cách này cĩ thể thu nhận mRNA từ những mẫu cĩ khối lượng rất
17 nhỏ. Sau khi tách chiết các nucleic acid cĩ thể được tinh sạch bằng các phương pháp siêu ly tâm, sắc ký hay điện di. 2.3. Phương pháp siêu ly tâm Siêu ly tâm trên một gradient liên tục cesium chloride (CsCl). Khi ly tâm, dung dịch CsCl đậm đặc trong ống ly tâm sẽ tự động hình thành một građient tỷ trọng với tỷ trọng tăng dần từ miệng ống xuống đáy ống. Dưới tác dụng của lực ly tâm, các nucleic acid di chuyển trong ống đến vị trí cĩ tỷ trọng bằng với tỷ trọng của chính chúng sẽ đạt thế cân bằng và ngừng lại, hình thành một lớp cố định trong ống. Sau khi ly tâm, lớp này sẽ được thu nhận lại. Phương pháp này thường được dùng để tinh sạch plasmid và phage. - Siêu ly tâm trên đệm CsCl (gradient khơng liên tục): Hỗn hợp nhiều nucleic acid cĩ tỷ trọng biết trước khác nhau được đặt trên một lớp dung dịch CsCl (đệm). Trong quá trình ly tâm chỉ cĩ những phân tử cĩ tỷ trọng cao hơn tỷ trọng lớp đệm mới di chuyển qua được lớp đệm. Ở đây, ống ly tâm bao gồm nhiều lớp đệm cĩ tỷ trọng tăng dần từ miệng đến đáy ống. Nucleic acid cần tinh sạch sẽ nằm ở mặt phân cách hai lớp đệm. Phương pháp này thường dùng để tinh sạch một lượng lớn phage. - Siêu ly tâm trên gradient saccharose: Thường dùng để phân tích thơ một hỗn hợp cĩ kích thước chênh lệch nhau nhiều kb. Ứng dụng chúng trong chọn lọc các đoạn DNA cĩ kích thước xác định dùng trong việc thiết lập các ngân hàng gen. 2.4. Phương pháp sắc ký Cĩ thể dùng các phương pháp sắc ký khác nhau để phục vụ cho các mục đích khác nhau trong tách chiết nucleic acid. - Sắc ký ái lực trên polyU - sepharose hay trên oligodT - cellulose để tinh sạch mRNA. - Sắc ký lọc gel trong phân tách các nucleic acid ra khỏi các nucleic tự do sau quá trình đánh dấu DNA hoặc RNA. - Sắc ký trao đổi ion trên vi cột để thu hồi những lượng rất nhỏ DNA. - Sắc ký lỏng cao áp (High Performance Liquid Chromatography - HPLC). Phương pháp cĩ độ phân giải cao này được dùng trong tinh sạch các oligonucleotide tổng hợp (độ phân
18 giải một nucleotide), plasmid, phân tách các đoạn DNA. 3. Các phương pháp phân tích định tính và định lượng thơ nucleic acid Muốn định tính và định lượng các nucleic acid, người ta phải tiến hành thu nhận chúng ở dạng sạch. Các phương pháp thường dùng trong định tính và định lượng chúng là phương pháp đo mật độ quang, điện di, siêu ly tâm, sắc ký. 3.1. Phương pháp định lượng bằng quang phổ kế Phương pháp này cho phép ước lượng tương đối nồng độ nucleic acid cĩ trong mẫu phục vụ yêu cầu nghiên cứu. Nguyên tắc của phương pháp đã được trình bày ở phần trước. Để kiểm tra độ sạch của dung dịch, người ta đo thêm giá trị OD ở 280 nm (OD280nm).Ở bước sĩng này, các protein cĩ mức hấp thụ cao nhất. Ngồi ra, các protein cũng hấp thụ ánh sáng ở bước sĩng 260 nm như các nucleic acid và do đĩ làm sai lệch giá trị thật của nồng độ nucleic acid. Một dung dịch nucleic acid được xem là sạch (khơng tạp nhiễm protein) khi tỷ số OD260nm/OD280nm đối với DNA là OD260nm/OD280nm ≥ 1,8; cịn đối với RNA là OD260nm/OD280nm ≥ 2. 3.2. Phương pháp điện di gel Cơ sở của phương pháp này đã được trình bày ở phần trước. Hai loại gel được sử dụng trong nghiên cứu nucleic acid là gel polyacrylamide và gel agarose. Việc chọn loại gel cũng như nồng độ các chất tạo thành gel tùy thuộc kích thước trung bình của các đoạn nucleic acid cần phân tách. Mối tương quan giữa nồng độ agarose và acrylamide cần sử dụng để phân tách các trình tự cĩ kích thước xác định được thể hiện qua bảng 1.1. 3.2.1. Gel polyacrylamide Thường dùng để tách các đoạn kích thước nhỏ dưới 1000 cặp base. So với gel agarose thì thao tác với gel này phức tạp hơn. Vì vậy, gel này chỉ được dùng cho những mục đích đặc hiệu. Ứng dụng chủ yếu của loại gel này là: - Tinh sạch các oligonucleotide tổng hợp - Xác định trình tự DNA - Tách các đoạn DNA cĩ chiều dài dưới 500 cặp base
19 Gel được đổ giữa hai tấm thủy tinh và điện di thực hiện theo chiều thẳng đứng. Bảng 1.1 Tương quan giữa nồng độ gel và kích thước các đoạn cần phân tách Kích thước các đoạn cần phân tách (cặp base: % acrylamide bp) 4 200 - 800 5 80 - 200 8 40 - 100 11 10 - 50 % agarose Kích thước các đoạn cần phân tách (kb) 0,6 - 0,8 1 - 20 0,9 - 1,2 0,5 - 7 1,2 - 1,5 0,2 - 5 3.2.2. Gel agarose Là loại gel thơng dụng nhất. Thao tác với loại gel này đơn giản, thường dùng để phân tách những đoạn cĩ kích thước trong khoảng 0,5 - 20kb. Gel được đổ trên một giá thể nằm ngang và điện di được thực hiện theo phương nằm ngang. Trong gel agarose các nucleic acid sẽ hiện hình dưới tia tử ngoại (UV) nhờ ethidium bromide. Hĩa chất này cĩ khả năng gắn xen vào giữa các base của nucleic acid và sẽ phát huỳnh quang dưới tác dụng của tia tử ngoại. Dưới sự chiếu sáng bằng tia tử ngoại (λ = 260 - 360 nm), nucleic acid sẽ hiện hình dưới dạng những vạch màu đỏ cam. Để ước lượng kích thước các trình tự nucleic acid trong gel agarose người ta sử dụng một yếu tố đánh dấu trọng lượng phân tử (molecular weight marker - MWM). Đĩ là tập hợp nhiều trình tự DNA cĩ kích thước đã biết (thang DNA - DNA ladder). Điện di trên gel agarose cịn được sử dụng để tinh sạch và thu nhận mẫu. Ở đây, sau khi điện di, các vạch tương ứng với DNA cần tinh sạch được phát hiện và thu nhận lại theo một trong các phương pháp sau: (i) Cắt phần agarose chứa các vạch DNA, sau đĩ thu nhận lại DNA bằng cách khuyếch tán từ gel agarose vào một dung dịch đệm thích hợp.
20 (ii) Khoét một “giếng” nhỏ trong agarose ngay dưới vạch DNA. Bơm dung dịch đệm vào đầy “giếng” và điện trường được tái lập. DNA di chuyển vào “giếng” chứa đầy dung dịch đệm và được thu nhận lại. (iii) Dùng gel agarose đặc biệt như Nusieve hay Seaplaque cĩ điểm nĩng chảy rất thấp (650C) cho điện di. Sau điện di, vạch DNA được cắt ra và ủ trong một dung dịch đệm ở nhiệt độ 650C. Khi agarose đã hồn tồn tan chảy DNA được thu nhận lại sau nhiều cơng đoạn tách chiết và kết tủa. 4. Các phương pháp xác định trình tự của nucleic acid Các phương pháp phân tích nucleic acid đã nêu đã cung cấp nhiều thơng tin về nucleic acid nhưng chưa cho phép kết luận về bản chất của một đoạn nucleic acid cụ thể. Thơng tin về sự tương ứng của nucleic acid với gene gì, cĩ chức năng điều hịa hay mã hĩa cho protein nào, chỉ cĩ thể rút ra được từ việc xác định trình tự nucleotide của nucleic acid. Các phương pháp xác định trình tự nucleic acid nĩi chung dựa vào hai nguyên tắc cơ bản, được tĩm tắt dưới đây (về chi tiết, cĩ thể tham khảo trong: Hồ Huỳnh Thuỳ Dương 1997; Đỗ Quý Hai 2001.): - Nguyên tắc hĩa học (Phương pháp Maxam - Gilbert, 1977): dựa vào các phản ứng hĩa học thủy phân đặc hiệu phân tử DNA, tạo thành một tập hợp nhiều phân đoạn cĩ kích thước khác nhau. - Nguyên tắc enzyme học (Phương pháp Sanger (1977) và các phương pháp cải biên): Dựa vào sự tổng hợp mạch bổ sung cho trình tự cần xác định nhờ DNA polymerase. Với việc sử dụng thêm dideoxynucleotide (nhĩm 3′-ON được thay bằng H) cùng với các deoxy nucleiotide thơng thường, kết quả tổng hợp cũng là sự hình thành một tập hợp nhiều đoạn DNA cĩ kích thước khác nhau. Ở cả hai trường hợp, các phân đoạn DNA sẽ được phân tách qua điện di trên gel polyacrylamide cĩ khả năng phân tách hai trình tự DNA chỉ chênh nhau một nucleotide. Với việc sử dụng một đoạn nucleotide cĩ đánh dấu đồng vị phĩng xạ, kết quả trình tự cần xác định dược đọc trên bản phĩng xạ tự ghi từ bản điện di. Câu hỏi ơn tập 1. Trình bày tĩm tắt lịch sử nghiên cứu các nucleic acid.
21 2. Mơ tả các phương pháp chung thường dùng trong nghiên cứu nucleic acid. 3. Trình bày nguyên tắc và ứng dụng của các phương pháp tách chiết nucleic acid. 4. Mơ tả các phương pháp phân tích định tính và định lượng thơ nucleic acid. 5. Sơ lược về các phương pháp xác định trình tự của các nucleic acid. Tài liệu Tham khảo Nguyễn Bá Lộc. 2000. Giáo trình Axit nucleic và Sinh tổng hợp protein. NXB Giáo dục. Đỗ Quý Hai. 2001. Bài giảng Axit Nucleic. Trường ĐHKH, Đại Học Huế. Phạm Thị Trân Châu và Trần Thị Áng (1992): Hố sinh học. NXB Giáo dục, Hà Nội. Hồ Huỳnh Thuỳ Dương. 1997. Sinh học Phân tử. NXB Giáo Dục. Lehninger L. et al. 1993. Principles of Biochemistry. Worth Publishers, New York. Stryer L. 1981. Biochemistry. W.-H. Freeman and Co., San Francisco.
21 Chương 2 Cấu trúc của các Nucleotide và Polynucleotide Việc nghiên cứu cấu trúc của các nucleic acid thực sự diễn ra từ giữa thập niên 1950, sau khi O.T.Avery, MacLeod và McCarty (1944) lần đầu tiên chứng minh: DNA là vật chất mang thơng tin di truyền. Cho đến nay, chúng ta biết rằng các nucleic acid, bao gồm deoxyribonucleic acid (DNA) và ribonucleic acid (RNA), là những đại phân tử sinh học cĩ trọng lượng phân tử lớn với thành phần gồm các nguyên tố C, H, O, N và P; chúng được cấu thành từ nhiều đơn phân (monomer) là các nucleotide. Các đơn phân này nối với nhau bằng các liên kết phosphodiester tạo thành các cấu trúc đa phân (polymer) gọi là các chuỗi, mạch (chain) hay sợi (strand) polynucleotide - cấu trúc sơ cấp của các phân tử nucleic acid. Trong chương này, chúng ta lần lượt tìm hiểu thành phần hố học và cấu trúc của các nucleotide và polynucleotide của DNA và RNA. I. Thành phần hĩa học của các nucleotide Vào giữa thập niên 1940, các nhà hố sinh học đã biết được các cấu trúc hố học của DNA và RNA. Khi phân cắt DNA thành các tiểu đơn vị, họ phát hiện ra rằng mỗi nucleotide của DNA gồm ba thành phần: một base nitơ (nitrogenous base), một đường deoxyribose, và một phosphoric acid. Tương tự, RNA cho ra các base, phosphoric acid và đường ribose. Các nucleotide cũng cĩ nhiều chức năng khác trong tế bào, ví dụ như các dịng năng lượng, các chất dẫn truyền thần kinh và các thơng tin loại hai như tải nạp tín hiệu chẳng hạn. 1. Base nitơ Các base nitơ (gọi tắt là base), thành phần đặc trưng của các nucleotide, là các hợp chất purine và pyrimidine dị vịng chứa nitơ cĩ tính kiềm. Về cơ bản, các dẫn xuất của purine bao gồm adenine (A) và guanine (G), cịn của pyrimidine gồm cĩ: thymine (T), uracil (U) và cytosine (C). DNA chứa bốn loại base chính là adenine, guanine, thymine và
22 cytosine. Trong RNA cũng chứa các base như thế, chỉ khác là uracil thay thế thymine (Hình 2.1). Cần chú ý rằng purine và pyrimidine là các base dị vịng chứa các nguyên tử nitơ nằm xen với các nguyên tử carbon, nên việc đánh số các vị trí khơng thêm dấu phẩy trên đầu như trong trường hợp của đường pentose (xem các Hình 2.4 - 2.6). Bên cạnh các dạng phổ biến nĩi trên, các purine khác cũng cĩ vai trị quan trọng trong trao đổi chất của tế bào, như: xanthine, hypoxanthine và uric acid; cịn đối với pyrimidine đĩ là các orotic và dihydroorotic acid . Ngồi ra cịn bắt gặp một số loại base hiếm thuộc cả hai nhĩm purine và pyrimidine. Đĩ là những base biến đổi chủ yếu do hiện tượng methyl hố (methylation) xảy ra ở các vị trí khác nhau, chẳng hạn: 1-methyladenine, 6-methyladenine, 2-methylguanine, 5- methylcytosine v.v. Hình 2.1 Cấu trúc các base của DNA và RNA. Adenine và guanine là các dẫn xuất của purine; cịn cytosine, thymine và uracil là các dẫn xuất của pyrimidine; trong đĩ uracil là đặc thù cho RNA và thymine cho DNA. Các base purine và pyrimidine cĩ thể tồn tại dưới các dạng hỗ biến (tautomeric forms) amino và imino (đối với adenine và cytosine; Hình 2.2A), hoặc keto và enol (đối với guanine và thymine; Hình 2.2B). Đĩ là hai trạng thái tồn tại bền (phổ biến) và
23 kém bền (ít phổ biến), cĩ thể biến đổi qua lại với nhau do sự dịch chuyển vị trí của các nguyên tử hydro trong các base purine và pyrimidine. Hình 2.2 cho thấy các dạng hỗ biến của các base trong DNA. Tương tự, uracil cĩ hai dạng hỗ biến: lactam (dạng keto) chiếm ưu thế ở pH = 7 và lactim (dạng enol) gia tăng khi pH giảm. Chính hiện tượng hỗ biến này dẫn tới thay đổi khả năng kết cặp bình thường của các base và làm phát sinh các đột biến gene dạng thay thế một cặp base. Các base phổ biến trong cả DNA và RNA là tương đối bền vững ở trạng thái hỗ biến được gọi là dạng hỗ biến ưu thế (dominant tautomeric form); cĩ lẽ đĩ là lý do tại sao chúng được chọn lọc để mang thơng tin di truyền. Nĩi chung, các base này đều ít tan trong nước và cĩ khả năng hấp thu ánh sáng cực đại ở 260- 270 nanomet (1nm = 10-9m). Chúng cĩ thể được tách ra bằng các phương pháp sắc ký và điện di. Adenine Cytosine (A) AMINO IMINO
24 Guanine Thymine (B) KETO ENOL Hình 2.2 Các dạng hỗ biến của các base trong DNA. (A) Các dạng amino (phổ biến) của adenine và cytosine cĩ thể biến đổi thành các dạng imino; và (B) các dạng keto (phổ biến) của guanine và thymine cĩ thể sắp xếp lại thành các dạng enol. Các mũi tên biểu thị sự dịch chuyển vị trí nguyên tử hydro. R là các gốc đường và phosphate. 2. Đường pentose Các đường chứa năm carbon (pentose) là sản phẩm của quá trình trao đổi chất trong tế bào, với nhiều loại như: arabinose, ribulose, ribose và dẫn xuất của nĩ là deoxyribose v.v. Đường pentose của RNA là D-ribose và của DNA là 2'-deoxy-D- ribose (ký hiệu D chỉ dạng đường quay phải trước ánh sáng phân cực để phân biệt với dạng L quay trái khơng cĩ trong thành phần của các nucleic acid tự nhiên). Các phân tử đường này đều cĩ cấu trúc vịng furanose (gọi như thế bởi vì nĩ giống với hợp chất furan dị vịng). Do các nguyên tử carbon ở đây xếp liên tục nên được đánh số thứ tự cĩ dấu phẩy trên đầu, ví dụ C1', C2' cho đến C5'. Hình 2.3 Cấu trúc của các phân tử đường ribose (trái) và deoxyribose (phải); chúng khác nhau ở nguyên tử carbon số 2.
25 Hai phân tử đường này khác nhau ở C2'; trong ribose đĩ là nhĩm hydroxyl và trong deoxyribose là một hydro (Hình 2.3). Do các gốc đường khác nhau này đã tạo ra hai loại nucleotide là ribonucleotide và deoxyribonucleotide, mà từ đĩ cấu tạo nên hai loại nucleic acid khác nhau tương ứng là RNA và DNA. Và chính sự khác biệt nhỏ nhặt về mặt cấu trúc này đã tạo nên các đặc tính hố lý rất khác nhau giữa DNA và RNA. Dung dịch DNA tỏ ra đặc quánh hơn nhiều do sự trở ngại lập thể (steric hindrance) và mẫn cảm hơn với sự thuỷ phân trong các điều kiện kiềm (alkaline), cĩ lẽ điều này giải thích phần nào tại sao DNA xuất hiện như là vật chất di truyền sơ cấp (primary genetic material). Cần để ý rằng, trong các phân tử đường này cĩ ba vị trí quan trọng cĩ chứa nhĩm hydroxyl (-OH) tự do, đĩ là: (i) nhĩm -OH ở vị trí C1' cĩ khả năng hình thành liên kết N-glycosid với gốc -NH của các base để tạo thành các nucleoside; (ii) nhĩm -OH ở vị trí C5' cĩ khả năng hình thành liên kết ester với nhĩm phosphate để tạo ra các nucleotide; và (iii) nhĩm -OH ở vị trí C3' cĩ khả năng hình thành liên kết phosphodiester với nhĩm phosphate của một nucleotide khác để tạo chuỗi polynucleotide. Như vậy, tính phân cực (polarity) trong gốc đường mà từ đĩ quyết định tính phân cực của các chuỗi polynucleotide được thể hiện ở hai vị trí C5' và C3'. 3. Phosphoric acid Phosphoric acid (H3PO4) là acid vơ cơ cĩ chứa phosphor (P), một nguyên tố đĩng vai trị quan trọng trong trao đổi chất và năng lượng của tế bào. Do cĩ chứa ba nhĩm -OH nên acid này cĩ thể hình thành liên kết ester với các gốc đường tại các vị trí C5' và C3' để tạo nên các nucleotide và chuỗi polynucleotide. Trong các nucleotide của DNA và RNA, nhĩm phosphate liên kết với các nucleoside tại C5' (xem Hình 2.5). Trong trường hợp phân tử điều hồ AMP vịng (cyclic AMP = cAMP), nhĩm phosphate tạo liên kết ester với hai nhĩm -OH ở C5' và C3' trong cùng một nucleotide. II. Cấu trúc của các nucleotide 1. Cấu trúc của các nucleoside Các base và đường trong RNA và DNA được nối với nhau thành các đơn vị gọi là nucleoside. Mỗi nucleoside được tạo thành do một base nối với một đường pentose tại vị trí C1' bằng một liên
26 kết β-N-glycosid . Cụ thể là, nguyên tử carbon C1' của đường nối với nguyên tử N1 của pyrimidine hoặc với nguyên tử N9 của purine (xem các Hình 2.4 - 2.6). Hình 2.4 Cấu trúc của bốn loại deoxynucleoside trong DNA. Tên gọi chính thức hay danh pháp của các nucleoside bắt nguồn từ các base tương ứng, trong đĩ các nucleoside là dẫn xuất của purine cĩ đuơi -osine và các dẫn xuất của pyrimidine cĩ đuơi - idine (Bảng 2.1). 2. Cấu trúc của các nucleotide Đơn vị cấu trúc cơ sở của các nucleic acid là các nucleotide. Các nucleotide là những ester phosphate của các nucleoside. Hiện tượng ester hố (esterification) cĩ thể xảy ra ở bất kỳ nhĩm hydroxyl tự do nào, nhưng phổ biến nhất là ở các vị trí 5' và 3' trong các nucleic acid. Về cấu trúc, mỗi nucleotide gồm ba thành phần kết dính với nhau như sau: gốc đường pentose nối với một base tại C1' bằng một liên kết β-glycosid và nối với nhĩm phosphate tại C5' bằng một liên kết phosphomonoester (Hình 2.5 và 2.6).
27 Liên kết ester Liên kết glycosid Đường Hình 2.5 Cấu trúc của một deoxyribonucleotide (dAMP, bên trái) và một ribonucleotide (UMP). Ở đây cho thấy các mối liên kết N-glycosid và ester. Như thế tính phân cực trong cấu trúc một nucleotide thể hiện ở các nhĩm hydroxyl thuộc hai vị trí C5' (tạo liên kết ester với nhĩm phosphate trong từng nucleotide) và C3' (tạo liên kết phosphodiester với nucleotide khác trong chuỗi polynucleotide).
28 Hình 2.6 Cấu trúc chi tiết của bốn loại deoxyribonucleotide trong DNA. Ở đây cũng chỉ ra danh pháp của các nucleoside và nucleotide. 3. Cấu trúc của các nucleoside di- và triphosphate Như đã đề cập, mỗi nhĩm phosphate (phosphate group) được nối với vịng của gốc đường bằng một liên kết phosphomonoester, và nhiều nhĩm phosphate cĩ thể nối nhau thành một dãy bằng các liên kết phosphoanhydride (hình 2.7). Sự ester hố ở C5' cĩ thể đi
29 với mono-, di- hoặc triphosphate (nguyên tử phosphor P được đánh dấu tương ứng với các vị trí từ C5' hướng ra ngồi là α, β và γ). Các nucleoside 5'-triphosphate là những hợp chất cho tổng hợp nucleic acid. Hai nhĩm hydroxyl cũng cĩ thể được ester hố bằng cách nối cùng một nhĩm phosphate để sinh ra một nucleotide vịng (cyclic nucleotide), ví dụ cAMP là 3'-5'-cyclic phosphate (đĩng vai trị tải nạp tín hiệu, điều hồ dương tính operon lactose; xem chương 6). Bảng 2.1 Danh pháp các nucleoside của RNA và DNA Deoxynucleoside Base Nucleoside (RNA) (DNA) Purine Adenine Adenosine = A deoxyadenosine = dA Guanine Guanosine = G deoxyguanosine = dG Hypoxanthine* Inosine* = I Khơng cĩ Pyrimidine Cytosine Cytidine = C deoxycytidine = dC Thymine Thường khơng cĩ (deoxy)thymidine = dT Uracil Uridine = U Thường khơng cĩ Ghi chú: * Đây là dạng hiếm, cĩ mặt trong thành phần của các RNA vận chuyển. Bởi vì thymine thường khơng cĩ trong RNA, nên tiếp đầu ngữ "deoxy" chỉ cho loại deoxynucleoside này thường được lượt bỏ và gọi tắt là thymidine. Tuy nhiên, trong các RNA vận chuyển thường cĩ ribothymidine chứa đường ribose. Các nhĩm phosphate (a) (b)
30 Hình 2.7 (a) Cấu trúc chi tiết của các nucleotide adenosine ở ba trạng thái mono-, di- và triphosphate; và (b) nicotinamide adenosine diphosphate (NADP). Nĩi chung, các nucleotide thường cĩ tính acid mạnh và tan trong nước. Các nucleoside monophosphate được xem là các axit đúng như tên gọi phản ảnh (ví dụ AMP là adenylic acid hay adenylate); chúng cĩ sự ion hố sơ cấp với pKa 1-2 và ion hố thứ cấp với pKa 6,5-7,0, như sau: - + -2 + -H2PO3 ↔ -HPO3 + H ↔ PO3 + H Tất cả các phosphate của các nucleoside di- và triphosphate đều ion hố, nhưng chỉ nhĩm tận cùng là cĩ ion hố thứ cấp. Các nucleotide này đều cĩ ái lực với cation hố trị hai như Mg2++ và Ca2++ (chúng tương tác với các nhĩm phosphate α và β hoặc β và γ). III. Cấu trúc của các chuỗi polynucleotide Các nucleotide trong DNA hoặc RNA nối với nhau bằng các mối liên kết đồng hố trị (covalent) cĩ tên là liên kết 3',5'- phosphodiester giữa gốc đường của nucleotide này với nhĩm phosphate của nucleotide kế tiếp, tạo thành chuỗi polynucleotide. Vì vậy các chuỗi này bao giờ cũng được kéo dài theo chiều 5'→3' (đầu 5' mang nhĩm phosphate tự do và đầu 3' chứa nhĩm -OH tự do). Chúng cĩ bộ khung vững chắc gồm các gốc đường và phosphate xếp luân phiên nhau, cịn các base nằm về một bên. Trình tự các base vì vậy được đọc theo một chiều xác định 5'→3'. Đây là cấu trúc hố học sơ cấp của DNA và RNA (Hình 2.8 và 2.9). Hình 2.8 Mơ hình cấu trúc chuỗi polynucleotide DNA. Ở đây cho thấy các vị trí 5'-phosphate và 3'-hydroxyl cũng như đường deoxyribose và liên kết
31 phosphodiester nối giữa các gốc đường này. Thơng thường người ta biểu diễn trình tự base 5'→3' theo chiều từ trái sang phải. Hình 2.8 cho thấy các chuỗi DNA và RNA chỉ khác nhau bởi base U hoặc T và gốc đường trong các nucleotide của chúng. Nếu bỏ qua sự khác biệt về gốc đường, ta cĩ thể hình dung trình tự các base của hai chuỗi polynucleotide của DNA và RNA đều sinh trưởng theo chiều từ 5' đến 3' (5'→3'), như sau: Chuỗi DNA: (5') pApApTpTpCpTpTpApApApTpTpC -OH (3') Chuỗi RNA: (5') pApApUpUpCpUpUpApApApUpUpC -OH (3') Đầu 5' Chuỗi DNA (a) Đầu 3' Đầu 5' Chuỗi RNA (b) Đầu 3'
32 Hình 2.9 Cấu trúc chuỗi polynucleotide của DNA (a) và của RNA (b). Các chuỗi polynucleotide bao giờ cũng được tổng hợp (kéo dài) theo chiều 5'→3'; chúng cĩ bộ khung "đường-phosphate" rất vững chắc và trình tự base được viết theo quy ước từ trái (đầu 5') sang phải (đầu 3') đối với chuỗi DNA ở đây như sau: 5'- dGdAdCdT -3', cịn đối với chuỗi RNA là 5'- GACU -3'. Cần lưu ý rằng, các hợp chất cho polymer hố là các nucleoside triphosphate, nhưng các monomer của một nucleic acid là monophosphate. Phản ứng trùng hợp này được xúc tác bởi các enzyme tương ứng là DNA- hoặc RNA polymerase và sinh ra các pyrophosphate (cĩ thể xem thêm trong: tái bản DNA và phiên mã ; chương 5 và 6). Các oligonucleotide là những nucleic acid ngắn (nghĩa là cĩ độ dài dưới 100 nucleotide). Các oligoribonucleotide tồn tại trong tự nhiên và được sử dụng như là những đoạn mồi (primer) trong tái bản DNA và cho các mục đích khác nhau trong tế bào (xem chương 5). Các oligonucleotide tổng hợp cĩ thể tạo ra bằng sự tổng hợp hố học và là nguyên liệu thiết yếu cho các kỹ thuật thí nghiệm [ví dụ như dùng để giải mã di truyền, chương 6; cĩ thể tham khảo thêm các kỹ thuật xác định trình tự DNA (DNA sequencing), phản ứng trùng hợp chuỗi bằng polymerase (polymerase chain reaction), lai in situ (in situ hybridization), mẫu dị nucleic acid (nucleic acid probe), lai nucleic acid (nucleic acid hybridization), liệu pháp gene (gene therapy); các chương 3-6].
33 Câu hỏi và Bài tập 1. Phân tích các thành phần hố học của các nucleotide và mối liên hệ giữa chúng. 2. Vẽ sơ đồ cấu tạo của: (a) các base purine và pyrimidine cĩ mặt trong thành phần của DNA và RNA; và (b) các đường ribose và deoxyribose. Từ đĩ so sánh cấu trúc của các nucleotide DNA và RNA. 3. Phân tích cấu trúc một nucleoside và một nucleotide của DNA và RNA. Cho các sơ đồ minh hoạ. 4. Phân tích sự hình thành chuỗi polynucleotide của DNA và RNA và chỉ ra những điểm giống và khác nhau giữa chúng. 5. Tính phân cực (polarity) thể hiện như thế nào trong cấu trúc của các nucleotide và chuỗi polynucleotide của DNA và RNA? Giải thích và cho các sơ đồ minh hoạ. Tài liệu Tham khảo Tiếng Việt Nguyễn Bá Lộc. 2004. Giáo trình Axit nucleic và sinh tổng hợp protein (tái bản). Trung tâm Đào tạo Từ xa - Đại học Huế. Hồng Trọng Phán. 1995. Một số vấn đề về Di truyền học hiện đại (Tài liệu BDTX cho giáo viên THPT chu kỳ 1993-1996). Trường ĐHSP Huế. Hồng Trọng Phán. 1997. Di truyền học Phân tử. NXB Giáo Dục. Hồng Văn Tiến (chủ biên), Lê Khắc Thận, Lê Dỗn Diên. 1997. Sinh hố học với cơ sở khoa học của cơng nghệ gene. NXB Nơng Nghiệp, Hà Nội. Nguyễn Tiến Thắng, Nguyễn Đình Huyên. 1998. Giáo trình Sinh hố hiện đại. NXB Giáo Dục. Tiếng Anh Blackburn G.M., Gait M.J. (Eds., 1996): Nucleic Acids in Chemistry and Biology. Oxford University Press, Oxford. Lehninger, .L. et al. (1993): Principles of Biochemistry. Worth Publishers, New York. Russell PJ. 2003. Essential Genetics. Benjamin/Cummings
34 Publishing Company, Inc, Menlo Park, CA. Stryer, L. (1981): Biochemistry. W.-H. Freeman and Co., San Francisco. Tamarin RH. 1999. Principles of Genetics. 6th ed, McGraw-Hill, Inc, NY. Twyman RM. 1998. Advanced Molecular Biology. BIOS Scientific Publishers Ltd/ Springer-Verlag Singapore Pte Ltd. Watson JD, Hopkins NH, Roberts JW, Steitz JA, Weiner AM. 1987. Molecular Biology of the Gene. 4th ed, Benjamin/Cummings Publishing Company, Inc, Menlo Park, CA. Weaver RF, Hedrick PW. 1997. Genetics. 3rd ed, McGraw-Hill Companies, Inc. Wm.C.Browm Publishers, Dubuque, IA.
33 Chương 3 Cấu trúc và Đặc điểm của DNA "DNA - phân tử quý giá nhất trong tất cả các phân tử" (James D. Watson) Sự khám phá ra cấu trúc phân tử DNA bởi James Watson và Francis Crick năm 1953 với những hệ quả sinh học của nĩ là một trong những sự kiện khoa học to lớn nhất của thế kỷ XX. Nếu như sự ra đời của tác phẩm "Nguồn gốc các lồi" (1859) của R.Ch.Darwin đã tạo nên một cuộc cách mạng to lớn trong tư tưởng nhân loại, thì khám phá này thực sự làm biến đổi hiểu biết của chúng ta về sự sống. Tồn bộ câu chuyện về việc phát minh ra phân tử kỳ diệu này đã được thiên tài Watson miêu tả hết sức sinh động trong cuốn hồi ký nhan đề "Chuỗi xoắn kép" (1968). Trong chương này, chúng ta sẽ lần lượt tìm hiểu thành phần hố học và cấu trúc của DNA cũng như các đặc tính hố lý của nĩ. Từ đĩ bí ẩn của sự sống dần dần hé mở những lời giải đáp thú vị, với biết bao thành tựu to lớn tác động lên mọi mặt của đời sống - xã hội trong suốt hơn 50 năm qua. I. Thành phần hĩa học của DNA Năm 1944, Oswald T. Avery và các đồng sự của mình chứng minh DNA là vật chất mang thơng tin di truyền, chứ khơng phải protein. Đến năm 1949, Erwin Chargaff áp dụng phương pháp sắc ký giấy vào việc phân tích thành phần hĩa học của DNA các lồi khác nhau (Bảng 3.1) đã khám phá ra rằng: Bảng 3.1 Thành phần base của DNA ở một số lồi AG+ AT+ Sinh vật A% T% G% C% T + C G + C Phage lambda 21,3 22,9 28,6 27,2 1,00 0,79 Phage T7 26,0 26,0 24,0 24,0 1,00 1,08 Mycobacterium tuberculosis 15,1 14,6 34,9 35,4 1,00 0,42 Escherichia coli 24,7 23,6 26,0 25,7 1,03 0,93 Aspergillus niger (nấm mốc) 25,0 24,9 25,1 25,0 1,00 1,00 Saccharomyces cerevisiae 31,3 32,9 18,7 17,1 1,00 1,79 Triticum (lúa mỳ) 27,3 27,1 22,7 22,8 1,00 1,19
34 Zea mays (ngơ) 26,8 27,2 22,8 23,2 0,98 1,17 Salmo salar (cá hồi) 29,7 29,1 20,8 20,4 1,02 1,43 Gallus domestica (gà nhà) 29,5 27,7 22,4 20,4 1,08 1,34 Homo sapiens (người) 30,9 29,4 19,9 19,8 1,01 1,52 (i) Số lượng bốn loại base trong DNA là khơng bằng nhau; (ii) Tỷ lệ tương đối của các base là khơng ngẫu nhiên; và trong tất cả các mẫu DNA nghiên cứu tồn tại mối tương quan về hàm lượng (%) giữa các base như sau: A ≈ T và G ≈ C, nghĩa là tỷ số (A+G)/ T+C) ≈ 1; và (iii) Mỗi lồi cĩ một tỷ lệ (A+T)/(G+C) đặc thù. II. Cấu trúc chuỗi xoắn kép DNA Vào năm 1951-52, việc nghiên cứu cấu trúc ba chiều của DNA bằng phân tích nhiễu xạ tia X được bắt đầu bởi Maurice Wilkins và Rosalind Franklin. Các bức ảnh chụp được 1952 (hình 3.1) gợi ý rằng DNA cĩ cấu trúc xoắn gồm hai hoặc ba chuỗi. Lúc này ở Anh cịn cĩ một số nghiên cứu khác nhằm phát triển lý thuyết nhiễu xạ của Linus Pauling để tìm hiểu cấu trúc DNA. Tuy nhiên, giải pháp đúng đắn nhất là chuỗi xoắn kép bổ sung do Watson và Crick đưa ra năm 1953 (Hình 3.2 và 3.3). Mơ hình này hồn hồn tồn phù hợp với các số liệu của Wilkins và Franklin cũng như của Chargaff. Sự kiện này mở ra một bước ngoặt mới cho cho sự ra đời và phát triển với tốc độ nhanh chĩng của di truyền học phân tử. (a) (b) Hình 3.1 (a) R.Franklin (trái) và M.Wilkins; và (b) Ảnh chụp cấu trúc DNA tinh thể bằng tia X của Franklin.
35 (a) (b) Hình 3.2 (a) J.Watson (trái) và F.Crick; và (b) Mơ hình cấu trúc tinh thể DNA. Hình 3.3 Các mơ hình cấu trúc chuỗi xoắn kép DNA. 1. Mơ hình Watson-Crick Mơ hình Watson-Crick (DNA dạng B; Hình 3.3) cĩ các đặc điểm sau: (1) DNA gồm hai chuỗi đối song song (antiparallel) cùng uốn quanh một trục trung tâm theo chiều xoắn phải, với đường kính 20Ao (1Angstrom = 10-10m), gồm nhiều vịng xoắn lặp lại một cách đều đặn và chiều cao mỗi vịng xoắn là 34 Ao, ứng với 10 cặp base (base pair, viết tắt là bp).
36 (2) Các bộ khung đường-phosphate phân bố ở mặt ngồi chuỗi xoắn và các base nằm ở bên trong; chúng xếp trên những mặt phẳng song song với nhau và thẳng gĩc với trục phân tử, với khoảng cách trung bình 3,4 Ao. (3) Hai sợi đơn gắn bĩ với nhau bằng các mối liên kết hydro (vốn là lực hĩa học yếu) được hình thành giữa các cặp base đối diện theo nguyên tắc bổ sung "một purine - một pyrimidine". Cụ thể là, trong DNA chỉ tồn tại hai kiểu kết cặp base đặc thù là A-T (với hai liên kết hydro) và G-C (với ba liên kết hydro) (Hình 3.3 và 3.4). (4) Tính chất bổ sung theo cặp base dẫn đến sự bổ sung về trình tự các base giữa hai sợi đơn của mỗi chuỗi xoắn kép. Vì vậy, trong bất kỳ một phân tử DNA sợi kép nào hoặc một đoạn của nĩ bao giờ cũng cĩ: A = T và G = C; nghĩa là: [A + G] = [T + C] hay AG+ = 1(đây là tỷ số giữa các base purine và các base pyrimidine), T + C AT+ cịn tỷ lệ là đặc thù cho từng lồi (thực chất đây là tỷ lệ giữa G + C hai base khơng bổ sung cho nhau hoặc giữa hai base cùng nhĩm, ví dụ A/G hoặc T/C). Như vậy, mơ hình cấu trúc chuỗi xoắn kép của Watson-Crick (1953) hồn tồn thoả mãn và cho phép lý giải một cách thoả đáng các kết quả nghiên cứu của Chargaff (1949). Vì vậy người ta gọi các biểu thức A = T và G = C là các quy luật hay quy tắc Chargaff (Chargaff's rules). Theo nguyên tắc bổ sung của các cặp base, ta cĩ thể xác định trình tự base ở sợi bổ sung khi biết được trình tự base của một sợi đơn. Ví dụ: Sợi cho trước: 5'- AATTCTTAAATTC -3' Sợi bổ sung: 3'- TTAAGAATTTAAG -5'
37 Hình 3.4 Hai kiểu kết cặp base của DNA. Cặp AT nối với nhau bằng hai liên kết hydro và cặp GC - ba liên kết hydro (biểu thị bằng các đường chấm: ). Các nguyên tử C1' đại diện cho vị trí của đường và phosphate ở mỗi cặp nucleotide. Tĩm lại, hai đặc điểm quan trọng nhất trong cấu trúc DNA là sự phân cực ngược chiều của hai sợi đơn (5'→3' và 3'→5') và nguyên tắc bổ sung của các cặp base (A-T và G-C). Đây là hai nguyên lý căn bản chi phối các cơ chế di truyền ở cấp độ phân tử (tái bản, phiên mã và dịch mã), mà ta cĩ thể hình dung tổng quát dưới dạng các kênh truyền thơng tin di truyền trong tế bào (được gọi là Giáo lý hay Lý thuyết trung tâm, Central Dogma, của Sinh học phân tử; Hình 3.5) sau đây:
38 Hình 3.5 Lý thuyết trung tâm của Sinh học phân tử Về tầm vĩc vĩ đại của phát minh cấu trúc phân tử DNA, Lawrence Bragg - Giám đốc Phịng thí nghiệm Cavendish (England) - đánh giá rằng: "Sự phát minh ra cấu trúc DNA với tất cả các hệ quả sinh học của nĩ là một trong các sự kiện khoa học to lớn nhất của thế kỷ chúng ta " (Watson 1968, bản Việt dịch của Lê Đình Lương và Thái Dỗn Tĩnh, Nxb KH-KT tr.9). Nhờ phát minh vĩ đại đĩ, Watson và Crick cùng chia xẻ với Wilkins giải thưởng Nobel năm 1962. Thật vậy, nhìn lại ta thấy rằng Watson và Crick đã cơng bố phác thảo về mơ hình cấu trúc DNA trong bài báo nhan đề "A Structure for Deoxyribose Nucleic Acid" trên tạp chí Nature Vol. 171, trang 737 ngày 25-4-1953 (& Đây là một bài báo khoa học kinh điển rất ấn tượng và khơng bình thường tý nào! Một cách chính xác, bài báo này chỉ dài 900 chữ với vỏn vẹn 128 dịng, nhưng đằng sau mỗi dịng là cả một lịch sử khoa học kỳ diệu, một câu chuyện thú vị. Bài báo này được cơng bố rất nhanh, chưa đầy một tháng kể từ sau ngày gởi đăng. Trên thực tế, Crick muốn làm sáng tỏ các hàm ý sinh học của mơ hình này, nhưng Watson thì chẳng hài lịng với cách làm như vậy. Hai ơng đã thoả thuận trong một câu mà nĩ đã trở thành một trong những câu nĩi giản lược vĩ đại trong tài liệu khoa học: "Chúng ta khơng thể khơng nhận thấy rằng nguyên tắc kết cặp base đặc thù mà chúng tơi nêu lên ngay lập tức gợi ra một cơ chế sao chép khả dĩ cho vật chất (di truyền) nĩi chung". ["It has not escaped our noticed that the specific base pairing we have proposed immediately suggests a possible copying mechanism for the general (genetic) material."].
39 Hình 3.6 Mơ hình tái bản của DNA do Watson gợi ý từ 1953. Như câu nĩi đầy khêu gợi này đã chỉ rõ, mơ hình của Watson và Crick quả thực gợi ra một cơ chế sao chép cho DNA. Vì một sợi là bổ sung (complement) của sợi kia, nên hai sợi cĩ thể được tách ra và mỗi sợi sau đĩ cĩ thể dùng làm khuơn (template) cho việc xây dựng nên một sợi mới cặp với nĩ (Hình 3.6). Bằng cơ chế tái bản bán bảo tồn (semiconservative replication) như thế sẽ đảm bảo được hai phân tử DNA con tạo ra cĩ cấu trúc giống hệt DNA cha mẹ, và qua đĩ các tế bào sinh ra sẽ chứa các gene giống nhau; nghĩa là cĩ thể giải thích được tại sao con cái thường giống cha mẹ. Quả thực đây là sự tiên đốn thiên tài mà sự đúng đắn của nĩ đã được chứng minh bằng các thực nghiệm khác nhau chỉ sau đĩ vài năm (xem chương 5). Đến đây hẳn là chúng ta cĩ thể hiểu tại sao Watson lại đưa ra được những nhận định sắc sảo tuyệt vời và cực kỳ chính xác đến như vậy, chẳng hạn: "Một cấu trúc tuyệt đẹp như thế, lẽ tự nhiên là phải tồn tại trên thực tế", hay "Cách giải quyết đúng khơng những phải đẹp mà cịn phải đơn giản". Bạn cĩ thể làm sáng tỏ điều này? Và bạn cĩ thể học được gì từ bài báo kinh điển của Watson và Crick với nhan đề "A Structure for Deoxyribose Nucleic Acid" trên tạp chí Nature ngày 25-4-1953 (& và từ Lời bình độc đáo của Tom Zinnen (2004) về bài báo khoa học này (& )? 2. Các dạng DNA xoắn phải và xoắn trái Mơ hình Watson-Crick hay DNA dạng B là cấu trúc phổ biến.
40 Tuy nhiên, sau này người ta cịn phát hiện ra nhiều dạng xoắn phải khác (A, C, D ); chúng cĩ một số biến đổi so với DNA-B (xem Bảng 3.2). DNA dạng A DNA dạng B DNA dạng Z Hình 3.7 Các mơ hình DNA dạng A, B và Z ( hình trên) và thiết diện cắt ngang của chúng cho thấy vị trí phân bố của một cặp base. Bên cạnh các dạng DNA xoắn phải, Alexander Rich và đồng sự (1979) cịn phát hiện thêm một dạng DNA xoắn trái duy nhất cho đến nay. Dạng DNA này cĩ bộ khung hình zigzag (nên gọi là DNA- Z, và cũng là chữ cái cuối cùng trong bảng chữ cái Latin) uốn gập khúc theo chiều xoắn trái, mỗi vịng xoắn dài 45,6Ao chứa 12 cặp base. Nhìn chung, so với DNA dạng B, DNA-Z dài và gầy hơn, các rãnh lớn bị dẹt ra phần bề mặt của chuỗi xoắn; cịn DNA dạng A ngắn và to mập hơn (Hình 3.7 và Bảng 3.2). Những vùng nào của DNA cĩ chứa các purine và pyrimidine
41 sắp xếp xen kẽ nhau trên một sợi thì cĩ thể tiếp nhận cấu hình DNA-Z, ví dụ: 5' GCGCGCGC 3' 3' CGCGCGCG 5' Sự chuyển đổi này cũng được tạo thuận lợi bởi sự cĩ mặt của 5- methylcytosine và bởi trạng thái siêu xoắn nghịch (negative supercoiling). DNA là một phân tử đơng học và vì vậy nĩ cĩ thể chuyển từ một cấu hình này sang một cấu hình khác dựa trên các lực bên ngồi trong tế bào. Cĩ thể là sự chuyển đổi từ dạng B sang dạng Z cĩ liên quan đến sự điều hồ biểu hiện gene. Mặc dù Rich khám phá DNA-Z khi nghiên cứu về các hợp chất mơ hình, cấu trúc này dường như cũng cĩ mặt trong các tế bào sống ở một tỷ lệ nhỏ song chức năng của nĩ vẫn cịn chưa thật sự hiểu rõ. Bảng 3.2 Một số đặc điểm chính của các DNA dạng A, B, C và Z Chiều Số bp/vịng Đường kính chuỗi Dạng xoắn xoắn xoắn A Phải 11,0 23Ao B Phải 10,0 19Ao C Phải 9,3 19Ao Z Trái 12,0 18Ao *Nguồn: J.Kimball (từ internet). Về chi tiết, cĩ thể xem trong Watson et al (1987, tr.249) và Twyman (1998; tr.229). 3. Các DNA mạch vịng sợi kép và sợi đơn Kể từ sau khám phá quan trọng của Watson và Crick, cho đến nay khơng những đã phát hiện thêm các dạng DNA xoắn phải và xoắn trái, mà trên thực tế cịn cĩ các bộ gene được tổ chức theo những thể thức khác, đĩ là: DNA sợi kép dạng vịng cĩ mặt ở hầu hết các bộ gene prokaryote, bộ gene một số virus và bộ gene tế bào chất của các tế bào eukaryote (các phân tử DNA ty thể và lạp thể); DNA sợi đơn vịng của một số virus ký sinh ở vi khuẩn; và bộ gene RNA của nhiều virus ký sinh ở các thực vật và động vật. Đáng kể là các virus RNA gây ung thư, HIV/AIDS và các virus thuộc họ corona gây viêm phổi cấp (SARS) với nhiều biến thể cĩ khả năng lây lan sang nhiều vật chủ khác nhau và cĩ nguy cơ làm xuất hiện nạn đại dịch trên phạm vi tồn cầu hiện nay. Vấn đề này sẽ được đề cập thêm ở mục III dưới đây và ở Bảng 3.3.
42 Ư Thảo luận thêm về các bậc cấu trúc của các nucleic acid: X Cấu trúc bậc một của nucleic acid là các chuỗi polynucleotide; Y Cấu trúc bậc hai của các nucleic acid được sinh ra bởi hai loại tương tác khơng phải đồng hố trị: sự kết cặp base (base pairing) và sự co cụm base (base stacking). Sự kết cặp base liên quan với các liên kết hydro và là lực chiếm ưu thế khiến cho các sợi nucleic acid kết hợp với nhau, nhưng cấu trúc được giữ ổn định bằng các tương tác hydrophobic giữa các base kề sát nhau mang lại bằng các điện tử pi (π) trong các vịng. Các mối tương tác π-π này được mơ tả như là các lực kéo co cụm base. Cấu trúc bậc hai của DNA được đặc trưng bằng sự kết cặp base giữa các phân tử để sinh ra các phân tử sợi kép hay sợi đơi (double-stranded or duplex; ký hiệu là dsDNA). Các cấu trúc bậc hai trong RNA, vốn tồn tại nguyên thuỷ ở dạng sợi đơn (single-stranded form), nĩi chung phản ảnh các mối tương tác base nội trong phân tử. y Trong cấu trúc của các chuỗi xoắn kép DNA, quan trọng nhất là sự kết cặp base bổ sung (complementary base pairing) A-T và G-C. Các cặp base Watson-Crick này (Watson-Crick base pairs) tạo thành cơ sở của hầu hết các tương tác cấu trúc bậc hai trong các nucleic acid, cũng như giải thích cho các quy tắc Chargaff, và chúng đồng thời xác định cách thức DNA cĩ thể hoạt động như là cái khuơn cho tái bản và phiên mã Trong RNA, uracil thay thế cho thymine, nhưng vì uracil cĩ cấu trúc hố học tương tự với thymine và hình thành các liên kết hydro với adenine y như thế, cả hai nucleic acid lai theo cùng các quy tắc chung. Tuy nhiên, vì các mối tương tác này cĩ mặt khắp nơi, nên cĩ những sơ đồ kết cặp base biến đổi đơi chút so với các kiểu kết cặp Watson-Crick; chúng đĩng các vai trị quan trọng trong việc hình thành các cấu trúc bậc hai và bậc ba. y Cho đến nay, bên cạnh các cặp base Watson-Crick chiếm ưu thế trong các cấu trúc và chức năng của các nucleic acid, người ta thấy cĩ 28 cách sắp xếp khả dĩ của ít nhất hai liên kết hydro giữa các base; điều này cung cấp cơ sở cho một nhĩm đa dạng các tương tác. Cĩ ý nghĩa đáng kể nhất trong số các cấu hình biến đổi này là các cặp base Hoogsteen (Hoogsteen base pairs), vốn gĩp phần vào cấu trúc bậc ba của tRNA và cho phép hình thành các chuỗi xoắn ba (triple helices). Một sự sửa đổi so với các cặp base Watson-Crick là các cặp linh hoạt (wobble pairs). Vấn đề này sẽ
43 được xem xét trở lại ở các chương 4 (cấu trúc và chức năng của tRNA) và 6 (mục III: mã di truyền, giả thuyết linh hoạt). y Về các cấu hình chuỗi xoắn và tính mềm dẻo cục bộ trong cấu trúc DNA: Bên cạnh cấu trúc DNA sợi kép (dsDNA) dạng B phổ biến do Watson và Crick đưa ra năm 1953, cịn cĩ các dạng biến đổi khác như đã đề cập ở trên. Một đặc điểm khác nữa đĩ là tính mềm dẻo cục bộ (local flexibility) trong cấu trúc DNA. Nhiều thực nghiệm đã cho thấy rằng DNA dạng B đặc biệt mềm dẻo linh hoạt, nĩ khơng tồn tại ở các dạng cĩ cấu hình cứng nhắc mà cĩ thể thay đổi một cách uyển chuyển giữa các cấu hình khác nhau do các hiện tượng đa hình cục bộ gây ra, chẳng hạn như DNA cĩ thể uốn gập và hốn chuyển chuỗi xoắn (helical transitions) nội trong một phân tử đơn (ví dụ sự hốn chuyển qua lại giữa các dạng B và Z đã nĩi ở trên). DNA cuộn gập cũng cĩ thể được cảm ứng bởi các protein và tạo vịng (circularization). Việc cuộn lại do cảm ứng cần thiết cho sự đĩng gĩi DNA trong các nhiễm sắc thể (Hình 3.10) và cho tái bản, tái tổ hợp và phiên mã (chương 5 và 6). Các protein cũng cĩ thể nhận biết DNA được cuộn lại theo thể thức nào đĩ (ví dụ các topoisomerase nhận biết các khởi điểm tái bản). y Cấu trúc bậc hai trong RNA và DNA khơng thuộc dạng sợi đơi: Trong RNA và các vùng DNA sợi đơn, cấu trúc bậc hai được xác định bằng sự kết cặp base nội phân tử. Cấu trúc bậc hai trong RNA đĩng vai trị chính yếu trong biểu hiện gene và điều hồ của nĩ. Ví dụ: sự kết cặp base giữa rRNA và mRNA kiểm sốt việc khởi đầu tổng hợp protein; sự kết cặp base giữa tRNA và mRNA xảy ra trong dịch mã; các cấu trúc kẹp tĩc trong RNA (RNA hairpin loop) và các vịng thân (stem loops) kiểm sốt sự kết thúc phiên mã, hiệu quả dịch mã và sự ổn định của mRNA; và sự kết cặp base RNA-RNA cũng đĩng vai trị quan trọng trong việc tách bỏ các intron (xem các chương 4 và 6). Z Cấu trúc bậc ba của các nucleic acid phản ảnh các mối tương tác gĩp phần kiến thiết tồn bộ hình dáng ba chiều của DNA và RNA. Điều này bao gồm các tương tác giữa các yếu tố cấu trúc bậc hai khác nhau, các mối tương tác giữa các sợi đơn và các yếu tố cấu trúc bậc hai, và các đặc điểm hình thể của các nucleic acid. y Các tương tác sợi bậc ba trong DNA: Trong DNA, các mối tương tác bậc ba cĩ liên quan tới sự tương tác giữa các sợi đơn với các sợi đơi hoặc tương tác giữa các sợi đơi với các sợi đơi, kết quả là tạo thành các cấu trúc bộ ba và bốn sợi (triple and
44 quadruple strand structures). Các guanine cĩ thể hình thành các bộ bốn base (base tetrads), và các DNA chứa các loạt gốc guanine cĩ thể tạo thành các cấu trúc bộ bốn mà từ đĩ cĩ thể gĩp phần vào cấu trúc telomere (chương 5). Ví dụ, DNA dạng H là một dạng của DNA bộ ba sợi nội phân tử xuất hiện trong các đoạn bắt cặp homopurine/homopyrimidine và cĩ liên quan các cặp base Hoogsteen. Bây giờ ta hãy hình dung các cấu trúc bậc ba được gọi là các vịng R (R-loop) tạo thành khi RNA được phiên mã từ DNA sợi kép được cố định tại chỗ (in situ), xảy ra chẳng hạn trong khi mồi hố cho tái bản ở plasmid ColE1. Các cấu trúc bậc ba bốn sợi, các chỗ nối trong mơ hình Holliday, cũng hình thành trong khi tái tổ hợp (cĩ thể xem tái tổ hợp tương đồng). y Các tương tác sợi bậc ba trong RNA: Việc RNA cuộn lại thành các cấu trúc phức tạp cĩ dính dáng tới các tương tác bậc ba giữa các sợi, các vịng (loops) và các sợi đơi. Ví dụ, trong tRNA cĩ các ví dụ về các bộ ba base, các đoạn của chuỗi xoắn ba, các chỗ nối phần thân (stem junctions; trong đĩ hai hoặc nhiều vùng sợi đơi được nối với nhau) và các mấu giả (pseudo-koots; tại đĩ các sợi tương tác với các vịng thân - stem loop). y Đối với các đặc điểm cấu trúc hình học của DNA, nếu như các phân tử DNA cĩ các đầu mút tự do (ví dụ một phân tử mạch thẳng) thì hai sợi mở xoắn quanh nhau theo cách tiện ích nhất về mặt năng lượng và phân tử đĩ được coi là được giãn xoắn (relaxed). Tuy nhiên, trong các DNA mạch vịng, khơng cĩ các đầu mút tự do và nĩ chỉ được biến đổi bằng cách cắt mở vịng, chứ khơng phải bằng cách làm biến dạng nĩ. Nếu như DNA ở dạng vịng khép kín tiến hành tháo xoắn thì cách duy nhất để làm giãn xoắn kiểu vặn xoắn như vậy được tạo ra thơng qua sự siêu xoắn (supercoiling), tại đĩ một sự vặn xoắn được đưa vào trong chính trục chuỗi xoắn. Trạng thái siêu xoắn là một dạng khác nữa của cấu trúc bậc ba của nucleic acid. Ý nghĩa sinh lý học của sự siêu xoắn là ở chỗ DNA khơng bị bĩ chặt thì thường khơng cĩ hoạt tính sinh học. Trạng thái siêu xoắn nghịch tỏ ra cần thiết cho nhiều quá trình thiết yếu, như: tái bản, phiên mã và kể cả tái tổ hợp, DNA siêu xoắn lưu giữ năng lượng để điều khiển các phản ứng này. Ở các eukaryote vốn chứa các nhiễm sắc thể mạch thẳng, các vùng bĩ chặt về mặt khơng gian được bắt đầu bằng cách tổ chức chromatin thành các vịng với các đầu mút được cố định bởi các protein chống đỡ; các nucleosome đưa các cuộn siêu xoắn nghịch vào trong DNA eukaryote (xem Hình 3.10).
45 [ Cấu trúc bậc bốn của các nucleic acid: Trong nhiều cấu trúc, các nucleic acid tương tác ở cấu hình trans (ví dụ, ribosome và spliceosome), và đây cĩ thể xem là bậc bốn của cấu trúc nucleic acid. Các nucleic acid cũng tương tác với một số lượng lớn các protein (ví dụ, các protein cấu trúc bộ gene, các yếu tố phiên mã, các enzyme, các nhân tố splicing). Khá nhiều các protein này gây một tác dụng đáng kể lên cấu hình DNA và RNA. Ví dụ enzyme cắt giới hạn EcoRI cĩ thể bám vào đoạn nhận biết trong DNA và từ đĩ phát huy hoạt tính cắt bên trong sợi III. Định khu, hàm lượng và kích thước của DNA 1. Sơ lược về bộ gene của các virus, prokaryote và eukaryote Virus là nhĩm "sinh vật" bé nhất chưa cĩ cấu tạo tế bào, khơng tồn tại đơn độc mà ký sinh bắt buộc ở các tế bào sinh vật tiền nhân (prokaryote) hoặc sinh vật nhân chuẩn (eukaryote); chỉ trong điều kiện đĩ chúng mới cĩ khả năng tái bản. Các virus ký sinh hoặc gây nhiễm vi khuẩn gọi là thể thực khuẩn (bacteriophage) hay phage. Cấu trúc của các virus tương đối đơn giản, gồm hai phần chính là lõi acid nucleic và vỏ protein (Hình 3.8). Một số virus ở thực vật hoặc các virus gây ung thư, AIDS, SARS ở người và động vật cĩ bộ gene là RNA. Số cịn lại bao gồm nhiều virus ký sinh ở vi khuẩn và động vật cĩ bộ gene là DNA sợi kép hoặc sợi đơn, cĩ mạch thẳng hoặc mạch vịng (Bảng 3.3). (a)
46 (b) (c) Hình 3.8 (a) Vi ảnh điện tử của phage T4 và sự bám của phage trêm màng tế bào E. coli (từ trái sang). (b) Bản đồ DNA sợi đơn vịng của phage φX174 với một số gene gối nhau. (c) Sơ đồ cấu trúc của HIV - một retrovirus. Nhĩm prokaryote bao gồm các vi khuẩn (bacteria) và vi khuẩn cổ (archae) là các sinh vật cĩ cấu tạo tế bào đơn giản nhất. Vi khuẩn Escherichia coli (hình 3.9) là đối tượng được sử dụng rộng rãi trong các nghiên cứu di truyền phân tử. Bộ gene chính của nĩ là một phân tử DNA sợi kép vịng cĩ kích thước lớn (4.639.221 cặp base, với 4290 gene mã hĩa protein và 53 gene RNA) gọi là nhiễm sắc thể chính. Nĩ thường tập trung ở một "vùng nhân" (nucleoid), khơng cĩ màng nhân bao bọc, và ở trạng thái siêu xoắn (supercoiled DNA) dưới sự kiểm sốt của các enzyme topoisomerase. Ngồi ra cịn cĩ nhiều phân tử DNA sợi kép trần mạch vịng khác cĩ kính thước bé hơn nhiều, gọi là các plasmid. Lưu ý: Từ đầu thập niên 1990 đến nay, người ta phát hiện thấy rằng tổ chức bộ gene DNA sợi kép của nhiều vi khuẩn khơng chỉ cĩ một phân tử mạch vịng (như ở Bacillus, E. coli, Pseudomonas, v.v.) mà cịn cĩ thể cĩ các trường hợp sau: 1 DNA mạch thẳng (Borella = 0,91 Mbp); 2 DNA mạch vịng (ví dụ: V. cholera = 2,9 + 1,1 Mbp); hoặc 3 DNA vịng (ví dụ: Paracoccus denitrificans = 2,0 + 1,1 + 0,64 Mbp); hoặc thậm chí bộ gene của Agrobacterium tumefaciens gồm một DNA mạch thẳng (2,1 Mbp) và một DNA mạch vịng (3,0 Mbp). Về phần các plasmid cũng vậy, ví dụ ở chi Borella cĩ rất nhiều plasmid vịng và thẳng với kích thước biến thiên từ 5 đến 200 Kbp. (1 Mbp = 103 Kbp = 106 bp). [Về chi tiết, cĩ thể xem trong chương 2 của Giáo trình Di truyền Vi sinh vật do Hồng Trọng Phán chủ biên; Nxb Đại Học Huế - 2006.]
47 (a) (b) Hình 3.9 (a) Ảnh chụp các tế bào E. coli . (b) Sơ đồ tổ chức vật chất di truyền của tế bào E. coli cùng với vi ảnh điện tử của plasmid pSC101 (hình dưới). Nhĩm eukaryote là nhĩm lớn nhất và tiến hĩa đa dạng nhất về trình dộ tổ chức cơ thể, bao gồm tất cả các sinh vật cĩ cấu tạo tế bào (trừ vi khuẩn và vi khuẩn lam), cĩ thể là đơn bào hoặc đa bào. Trong tế bào chứa hai hệ thống di truyền, bộ gene nhân và bộ gene tế bào chất. Bộ gene tế bào chất bao gồm các phân tử DNA sợi kép vịng, đĩ là: các DNA ty thể (mitochondrial DNA = mtDNA) cĩ mặt trong tất cả các tế bào eukaryote, cịn DNA lạp thể (chloroplast DNA = cpDNA hay ctDNA) chỉ cĩ trong các tế bào thực vật (xem mục 4). Trong nhân tế bào eukaryote chứa nhiều nhiễm sắc thể; mỗi nhiễm sắc thể là một phức hợp nucleoprotein (cịn gọi là chất nhiễm sắc, chromatin), gồm một phân tử DNA mạch kép thẳng kết hợp với các phân tử protein cơ sở cĩ tên là các histone (giàu lysine và arginine). Đơn vị tổ chức của cơ sở của nhiễm sắc thể eukaryote là các nucleosome (hình 3.10a) cĩ đường kính khoảng 11 nm, gồm một khối cầu tám phân tử histone, (H2A+ H2B +H3+H4)2, gọi là lõi octamer và đoạn DNA cĩ kích thước 146 cặp base quấn xung quanh nĩ 1¾ vịng (thường được mơ tả là 160- 200 bp quấn hai vịng quanh octamer). Một phân tử H1 bám vào các vùng DNA nối (linker DNA) bên ngồi nucleosome, giữ vững sự tương tác của DNA với các histone lõi. Các mức độ tổ chức hay sự hố xoắn của nhiễm sắc thể eukaryote được mơ tả ở hình 3.10b.
48 (a) (b) (c) Hình 3.10 Tổ chức DNA trong nhiễm sắc thể eukaryote. (a-b) Cấu trúc một nucleosome và chuỗi nucleosome; (c) Các mức độ tổ chức của vật chất di truyền ở tế bào eukaryote. 2. Mối quan hệ giữa kích thước bộ gene và tính phức tạp về mặt tiến hĩa Dựa trên các kết quả phân tích bộ gene của các virus và vi
49 khuẩn cũng như của bộ gene ở eukaryote (bộ nhiễm sắc thể đơn bội), cho phép khái quát như sau: Kích thước của bộ gene tăng lên tương đối cùng với mức độ phức tạp về tiến hĩa. Thật vậy, từ bảng 3.3 cho thấy rằng kích thước bộ gene của các virus nĩi chung là rất nhỏ so với nhĩm prokaryote; và kích thước bộ gene của các prokaryote lại tỏ ra quá đơn giản so với ngay cả một eukaryote đơn bào như nấm men. Trong khi DNA của một vi khuẩn điển hình như E. coli hơn 4,6 triệu cặp base và chứa 4.377 gene mã hĩa protein (khơng kể 53 gene RNA), thì phage MS2 là một trong các virus bé nhất, bộ gene RNA của nĩ cũngchỉ cĩ 3.569 base với tất cả 4 gene; hoặc cĩ kích thước lớn như virus Epstein-Barr (bộ gene DNA sợi kép mạch vịng) cũng chỉ cĩ 172.282 cặp base với tất cả 80 gene. Nếu xét trên cả hai nhĩm prokaryote và eukaryote, ta thấy rằng kích thước các bộ gene biến thiên rất rộng: bộ gene đối với một sinh vật sống tự do (một vi khuẩn) được biết là bé nhất chứa khoảng 600.000 cặp base DNA, trong khi các bộ gen người và chuột là khoảng 3 tỷ. Nếu xét riêng ở nhĩm eukaryote, ta đã biết mỗi lồi cĩ một số lượng nhiễm sắc thể đặc trưng và nĩ khơng phản ánh trình độ tiến hĩa của các lồi. Tuy nhiên, về mặt nào đĩ rõ ràng là cĩ sự tương quan thuận giữa hàm lượng DNA của các bộ gene đơn bội và nấc thang tiến hĩa của các động-thực vật. Dù vậy vẫn cĩ một số ngoại lệ so với quy tắc này! 3. Hàm lượng DNA và nghịch lý giá trị C Chẳng hạn, mặc dù Psilotum nudum, đơi khi gọi là "dương xỉ lơng", là một thực vật đơn giản hơn nhiều so với lồi Arabidopsis thaliana vốn là một thực vật cĩ hoa thuộc họ cải, nhưng nĩ lại cĩ kích thước bộ gene lớn hơn tới 3.000 lần. Đĩ là do trên 80% bộ gene của nĩ là DNA lặp lại khơng chứa thơng tin di truyền nào cả! Hay một số thực vật (như ngơ, loa kèn) hay một số động vật (như lưỡng thê, cá) lại cĩ kích thước bộ gene lớn gấp nhiều lần so với lớp thú (bảng 3.3). Một số lưỡng thê chứa DNA nhiều gấp bộ gene chúng ta đến 30 lần, nhưng chắc chắn khơng phải là chúng phức tạp gấp chúng ta 30 lần. Người ta gọi tổng hàm lượng DNA trong bộ gene đơn bội là giá trị C (C-value). Với phân tích ở trên cho thấy khơng hề tồn tại một mối quan hệ kiên định nhất quán giữa giá trị C và tính phức tạp của một sinh vật (như lưỡng thê với thú); cái đĩ gọi là nghịch lý giá trị C
50 (C-value paradox). Bảng 3.3 Kích thước bộ gene của một số sinh vật thường gặp Số Bộ gene sinh vật Số bp gene Ghi chú Virus Phage Ø-X174 (ở E. coli) 5.386 10 DNA sợi đơn vịng DNA sợi kép Phage lambda (ở E. coli) 48.502 ~61 thẳng Phage T2 hoặc T4 (ở E. 150- DNA sợi kép coli) ~2x105 200 thẳng Phage MS2 (ở E. coli) 3.569 4 RNA SV40 (gây khối u ở khỉ) 5.226 DNA sợi kép vịng RNA; viêm phổi Virus SARS (ví dụ, H5N1) 29.600 cấp DNA sợi kép Epstein-Barr virus (EBV) 172.282 80 thẳng Prokaryote Gây nhiễm tai Haemophilus influenzae 1.830.138 1.738 giữa Bệnh lây qua tình Chlamydia trachomatis 1.042.519 936 dục Streptococcus pneumoniae 2.160.837 2.236 Pneumococcus Ở 2 NST; gây Vibrio cholerae 4.033.460 3.890 cholera Mycobacterium tuberculosis 4.411.532 3.959 Gây bệnh lao Bacillus subtilis 4.214.814 4.779 Escherichia coli (1) 4.639.221 4.377 Cĩ 4290 cistron Agrobacterium tumefaciens (2) 4.674.062 5.419 Vector hữu ích E. coli O157:H7 5.44 x 106 5.416 Gây bệnh ở người Eukaryote 12.495.68 Saccharomyces cerevisiae 2 5.770 Men bia nảy chồi Schizosaccharomyces 12.462.63 Nấm men phân pombe 7 4.929 cắt 22.853.76 Gây sốt rét nguy Plasmodium falciparum (3) 4 5.268 nhất 38.639.76 Neurospora crassa 9 10.082 + 498 gene RNA 100.258.1 ~19.00 Caenorhabditis elegans (4) 71 0Giải tr.tự đầu tiên Arabidopsis thaliana 115.409.9 25.498 Thực vật cĩ hoa
51 49 122.653.9 Drosophila melanogaster 77 13.379 Ruồi giấm ~25.00 Người (Homo sapiens) (5) ~3,2 x 109 0 Hồn tất 4/2003 ~60.00 Lúa (Oryza sativa ) 4,3 x 108 0 Chuột (Mus musculus) 2,2 x 109 ? Lưỡng thê (Xenopus laevis) 109 - 1011 ? Chú thích: (1) Cĩ 4290 gene mã hĩa protein, cịn lại là RNA; (2) Vector hữu ích để chuyển gen ở thực vật; (3) Cộng với 53 gene RNA; (4) Eukaryote đa bào đầu tiên được xác định trình tự; (5) Được xác định đầy đủ trình tự vào 4/2003 bởi HGP, với tổng cộng 3.164.700.000 cặp base; và theo ước tính mới nhất cơng bố ngày 21/10/2004 trên tạp chí Nature, bộ gene người chúng ta chứa khoảng 20.000-25.000 gene mã hĩa protein chiếm khoảng 2% tồn bộ bộ gene. 4. Kích thước DNA một số bào quan Kích thước DNA của một số bào quan (bảng 3.4) cho thấy chúng cĩ vẻ đơn giản và khơng cĩ dấu hiệu tiến hĩa rõ rệt. Nĩi chung, kích thước mỗi phân tử DNA ty thể của người và các động vật cĩ vú thường nằm trong khoảng 15.000-17.000 bp; ví dụ mtDNA người là 16.569 bp. Trong khi đĩ, kích thước một DNA lạp thể ở phần lớn tế bào các thực vật thường biến thiên trong khoảng 130.000 - 150.000 bp. Chẳng hạn, cpDNA ở lúa trồng (O. sativa) thuộc hai nhĩm indica và japonica cĩ kích thước tương ứng là 134.494 bp và 135.525 bp, ở lúa mỳ (Triticum aestivum) là 134.545 bp và ở ngơ (Zea mays) là 140.384 bp, v.v. Cịn các plasmid của một số tế bào thực vật thường cĩ kích thước rất bé khoảng 1-2 ngàn cặp base. Bảng 3.4 Kích thước DNA bào quan ở một số sinh vật nhân chuẩn Số cặp Số cặp DNA ty thể base Plasmid base Người (Homo sapiens) 16.569 O. sativa (indica) 1.485 O. sativa D. melanogaster 19.517 (japonica) 2.135 S. cerevisiae 85.779 Ngơ (Zea mays) 1.913
52 Số cặp DNA lạp thể base Brassica 11.640 Lúa O. sativa (indica) 134.494 N. crassa (3 loại) 3.581 O. sativa (japonica) 134.525 3.675 Ngơ (Zea mays) 140.384 7.050 Mía (S. officinarum) 141.182 IV. Đặc tính hĩa lý của DNA 1. Biến tính và hồi tính của DNA Một trong những đặc điểm quan trọng nhất của DNA là hai mạch đơn bổ sung của nĩ gắn với nhau bằng các mối liên kết hydro, vốn là lực liên kết hĩa học yếu nên chúng cĩ thể bị phân hủy dưới tác dụng của các enzyme, năng lượng làm cho hai mạch đơn của chuỗi xoắn kép tách rời nhau, gọi là biến tính (denaturation). Nhờ đĩ DNA mới cĩ thể tái bản, các gene mới cĩ thể biểu hiện ra các sản phẩm của mình. Mặt khác, DNA cĩ thể phục hồi trở lại trạng thái ban đầu theo một quá trình ngược lại, gọi là hồi tính (renaturation). Bằng thực nghiệm, người ta đã chứng minh điều đĩ bằng cách sử dụng các tác nhân vật lý và hĩa học khác nhau. Chẳng hạn, khi đun nĩng từ từ các phân tử DNA lên tới nhiệt độ gần 100oC (thường là 90-95oC), thì các liên kết hydro của chúng bị phá hủy hồn tồn và hai sợi bổ sung tách ra. Ngược lại, khi làm nguội từ từ dung dịch đốt nĩng chứa DNA bị biến tính hồn tồn, các sợi đơn thường cặp lại với sợi bổ sung của chúng và làm phục hồi chuỗi xoắn kép như lúc đầu. Rõ ràng đây là các quá trình cĩ tính thuận-nghịch. 1.1. Biến tính hay sự tách hai sợi của chuỗi xoắn kép DNA Trong khi các tỷ số G với C và A với T trong DNA của một sinh vật là cố định, thì hàm lượng GC (tỷ lệ phần trăm của G + C) cĩ thể sai khác nhau một cách đáng kể giữa các DNA thuộc các lồi khác nhau. Ở bảng 3.5 cho thấy hàm lượng GC của DNA nhiều lồi sinh vật. Các trị số này biến thiên từ 22% đến 73%, và những sự khác nhau này được phản ảnh trong sự sai khác về các đặc tính của DNA. Ở nhiệt độ vừa phải hoặc khi cĩ mặt các tác nhân gây biến tính
53 như kiềm hay formamide, thì các phân tử DNA bị biến tính từng phần. Khi đĩ tại các vùng giàu cặp A-T sẽ tách từng phần trước, trong khi các vùng giàu cặp G-C vẫn giữ nguyên đặc tính xoắn kép (Hình 3.11). Điều này cĩ thể lý giải là do mỗi cặp A-T chỉ cĩ hai liên kết hydro hiển nhiên là kém bền hơn so với mỗi cặp G-C vốn cĩ tới ba liên kết như thế. Bảng 3.5 Hàm lượng tương đối (G + C) của các DNA khác nhau (G+C) (G+C) Nguồn DNA Nguồn DNA % % Dictyostelium (mốc nhầy) 22 Lách chuột 44 Streptococcus pyogenes 34 Tinh trùng cá hồi 44 Vaccinia virus 36 B. subtilis 44 Bacillus cereus 37 Phage T1 46 B. megaterium 38 Escherichia coli 51 Hemophilus influenzae 39 Phage T7 51 Saccharomyces cerevisiae 39 Phage T3 53 Tuyến ức bê 40 Neurospora crassa 54 Pseudomonas Gan chuột (Rattus) 40 aeruginosa 68 Tinh trùng bị đực 41 Sarcina lutea 72 Streptococcus Micrococcus pneumoniae 42 lysodeikticus 72 Mầm lúa mỳ 43 Herpes simplex virus 72 Gan gà 43 Mycobacterium phlei 73 Nhiệt độ mà tại đĩ các sợi DNA bị biến tính hay tách nhau một nửa được gọi là nhiệt độ nĩng chảy (melting temperature), hay Tm. Tm là điểm giữa của pha chuyển tiếp (Hình 3.13) và nĩ tùy thuộc vào hàm lượng GC của DNA, nghĩa là đặc trưng cho DNA mỗi lồi (Hình 3.14). Ví dụ, DNA của E. coli với 50-51% GC thì cĩ Tm là 69- 70oC (Hình 3.14). Tương tự, kết quả xử lý nhiệt đối với DNA phế cầu khuẩn Streptococcus pneumoniae và nhiệt độ nĩng chảy của nĩ được đo bằng sự gia tăng độ hấp thụ ở 260 nm cho phép thu được đường cong nĩng chảy của vi khuẩn này. Tm cho DNA này dưới những điều kiện như thế là khoảng 85oC
54 DNA sợi đơn DNA soi kep gi Soi don chua bi nong c DNA sợi kép Soi kep giau A-T thanh ang soi don 220 260 300 Hình 3.11 Vi ảnh điện tử của Hình 3.12 Hyperchromicity. Sự DNA bị biến tính từng phần. Các hấp thụ của một dung dịch DNA (trên búp sợi đơn (mũi tên dưới) là vùng trục tung) tăng lên cực đại ở 260 nm giàu AT bị biến tính trước, trong khi (thuộc vùng cực tím của quang phổ) các vùng sợi kép dày hơ n (mũi tên khi chu ỗi xoắn kép bị biến tính thành trên) vẫn cịn chưa bị biến tính. các sợi đơn. 100 50 DNA E. coli vốn chứwhicha 50% G-C, 50 o cĩ hasTm b aằ ng 69 C 0 50 70 90 60 70 80 Hình 3.13 Đường cong nĩng Hình 3.14 Sự phụ thuộc của Tm chảy DNA. Tỷ lệ phần trăm hyper- vào hàm lượng G+C của ba DNA chromicity (ở trục tung) cĩ thể được khác nhau. Hàm lượng GC trung dùng theo sự biến tính của DNA như bình cĩ thể được xác định từ nhiệt độ là một hàm số của sự gia tăng nhiệt nĩng chảy của DNA. Ví dụ, đường độ (ở trục hồnh). Nhiệt độ tại điểm cong bên trái nĩi lên một DNA cĩ hàm gi ữ a c ủ a đư ờ ng cong nĩng ch ả y l ượ ng G+C th ấ p h ơ n so v ớ i DNA E. được gọi là Tm. coli (đường cong ở giữa). Cần lưu ý rằng hàm lượng tách sợi, hay nhiệt độ nĩng chảy, được đo bằng sự hấp thụ của dung mơi DNA ở 260 nm (Hình 3.12). Các nucleic acid hấp thụ ánh sáng ở bước sĩng này do cấu trúc điện tử trong các base của chúng, nhưng khi hai sợi của DNA lại gần nhau, thì khoảng cách gần gũi của các base trên hai sợi làm giảm bớt phần nào sự hấp thụ này. Khi hai sợi tách ra thì hiện tượng này biến mất và độ hấp thụ tăng lên 30-40%. Hiện tượng này được gọi là sự dịch chuyển do thừa sắc tố (hyperchromic shift;
55 Hình 3.12) và thuật ngữ chính thức chỉ cho hiện tượng này là hyperchromicity. Sự tăng tiến độ dốc trên đường cong cho thấy các sợi giữ vững màu cho tới khi nhiệt độ tiệm cận Tm và sau đĩ nhanh chĩng buơng ra. Hàm lượng GC của một DNA cĩ một tác dụng đáng kể lên Tm của nĩ. Trên thực tế, hàm lượng GC của DNA càng cao thì Tm của nĩ càng cao (Hình 3.14). Tại sao như vậy? Ta nhớ lại rằng một trong những lực giữ cho hai sợi gắn với nhau là liên kết hydro, trong khi các cặp A-T chỉ cĩ hai liên kết thì các cặp G-C cĩ tới ba liên kết. Vì vậy hai sợi của DNA giàu GC sẽ giữ chặt hơn là hai sợi của DNA giàu AT. Tĩm lại, hàm lượng GC của một DNA cĩ thể biến thiên từ 22% ở nấm mốc nhầy Dictyostelium đến 73% ở Mycobacterium phlei (Bảng 3.5). Điều này cĩ thể gây một hiệu quả mạnh lên các đặc tính hĩa lý của DNA, đặc biệt là lên nhiệt độ nĩng chảy tăng tuyến tính với hàm lượng GC. Nhiệt độ nĩng chảy (Tm) của một phân tử DNA là nhiệt độ mà tại đĩ hai sợi bị biến tính hay tách nhau một nửa. Ngồi ra, nồng độ ion thấp và các dung mơi hữu cơ cũng thúc đẩy sự biến tính của DNA. 1.2. Sự phục hồi trạng thái nguyên thể của DNA (renaturation) Một khi hai sợi của DNA tách ra, dưới những điều kiện thích hợp chúng cĩ thể kết hợp trở lại và làm phục hồi trạng thái ban đầu (renaturation, annealing). Gĩp phần vào hiệu quả "hồi tính" này của DNA cĩ nhiều nhân tố. Dưới đây nêu lên ba nhân tố quan trọng nhất: 1. Nhiệt độ. Nhiệt độ tốt nhất cho sự hồi tính của một DNA là khoảng 25oC dưới nhiệt độ nĩng chảy của nĩ. Nhiệt độ này là đủ thấp để cho sự biến tính khơng xảy ra nữa, nhưng đủ cao để cho phép khuyếch tán nhanh và làm yếu đi liên kết khơng bền giữa các trình tự kết cặp nhầm và các vùng kết cặp base ngắn trong sợi. Điều này gợi ra rằng việc làm nguội nhanh theo sau sự biến tính sẽ cản trở sự hồi tính. Thật vậy, quy trình chung đảm bảo cho DNA bị biến tính dừng biến tính lại là đột ngột chuyển dung dịch DNA vào trạng thái đĩng băng. Điều này được gọi là quenching. 2. Nồng độ DNA. Nồng dộ DNA trong dung dịch cũng quan trọng. Trong giới hạn hợp lý, nồng dộ DNA càng cao thì hai sợi bổ sung sẽ càng dễ dàng bắt gặp nhau trong một thời
56 gian nào đĩ. Nĩi cách khác, nồng độ càng cao thì sự hàn gắn trở lại càng nhanh. 3. Thời gian hồi tính. Rõ ràng là, thời gian cho phép hai sợi hàn gắn trở lại càng dài thì sẽ càng dễ dàng xảy ra. R.J. Britten và D.E. Kohn phát minh ra thuật ngữ, Cot, để gộp các nhân tố nồng độ DNA và thời gian. Cot (đọc là "cot") là sản phẩm của nồng độ DNA ban đầu (Co) tính theo số mole của các nucleotide trên mỗi lít và thời gian (t) tính bằng giây. Tất cảc các nhân tố khác được coi là ngang bằng nhau thì mức độ hồi tính của các sợi bổ sung trong một dung dịch DNA sẽ phụ thuộc vào Cot; cái đĩ gọi là đường cong Cot. Nếu ta coi tỷ lệ kết hợp lại tăng lên theo hướng đi xuống trên trục y, thế thì các đường cong đổ dốc biểu thị cho sự hồi tính các DNA. Hình 3.15 và 3.16 (kèm theo các chú thích chi tiết) dưới đây cho thấy phản ứng tái kết hợp DNA (cho một loại DNA sợi đơn) và đường cong Cot đối với năm mẫu DNA khác nhau cĩ các mức độ phức tạp khác nhau rất là lớn. log Cot 0 Cot1/2 = 1 / k2 p trong đĩ ợ th k2 = hằng số tỷ lệ bậc hai ế Co = nồng độ DNA 50 t1/2 = thời gian nửa phản ứng % DNAtái k 100 C t o 1/2 Hình 3.15 Phản ứng tái kết hợp DNA hay đường cong Cot lý tưởng đối với một loại DNA sợi đơn. Chú thích: Ở đây cho thấy mẫu DNA của E. coli. Phản ứng được biểu diễn trên đồ thị như là một sơ đồ bán-log với "log Cot" trên trục x và "tỷ lệ % DNA tái kết hợp" trên trục y (0% ở trên và 100% ở dưới). Phản ứng xảy ra theo sự vận động bậc hai lý tưởng. Cot là sản phẩm của Co (nồng độ DNA) và t (thời gian). Như vậy, nếu nồng độ DNA ổn định, trục x đơn thuần là tiến trình thời gian của phản ứng. Tiến trình phản ứng xảy ra như sau: tại thời điểm zero DNA bị biến tính thành các sợi đơn và các điều kiện đĩ được kết nối để thúc đẩy sự kết cặp base của DNA để cho phép sự hồi tính DNA xảy ra; tại một nửa thời gian của phản ứng (t1/2) thì cĩ 50% DNA được tái kết hợp. Điểm này là Cot1/2 của phản ứng mà nĩ xác định tỷ lệ nghịch của hằng số tỷ lệ tái kết hợp bậc hai, k2. Nĩi
57 cách khác, hằng số tỷ lệ đối với một mẫu DNA cĩ thể được xác định về mặt thực nghiệm bằng cách đo Cot1/2 của phản ứng. Hằng số tỷ lệ sau đĩ sẽ cung cấp độ phức tạp của DNA bằng cách so sánh nĩ với các hằng số tỷ lệ của các mẫu DNA khác cĩ độ phức tạp đã biết. Độ phức tạp được biểu hiện như là số lượng cặp base (bp) 100 101 102 103 104 105 106 107 108 109 1010 12 345 Cot1/2 10-6 10-5 10-4 10-3 10-2 10-1 100 101 102 103 104 Cot Hình 3.16 Đường cong Cot đối với năm mẫu DNA khác nhau cĩ các độ phức tạp rất khác nhau sau đây: 1- poly(dA)-poly(dT); 2- DNA vệ tinh của người được tinh chiết; 3- DNA phage T4; 4- DNA bộ gene E. coli; và 5- DNA bản sao đơn của người được tinh chiết. Chú thích: Mỗi DNA tái kết hợp với một tỷ lệ nhất định, phụ thuộc vào mức độ phức tạp đặc trưng riêng của nĩ (xem các trị số về độ phức tạp ở hàng ngang phía trên). Mẫu 1 là trình tự đơn giản nhất. Nĩ là DNA sợi kép gồm các homopolymer poly(dA) và poly(dT) cặp với nhau. Theo định nghĩa cĩ tính chất quy ước, nĩ cĩ độ phức tạp là "một" bởi vì nĩ bao gồm các đoạn lặp của chỉ các cặp A-T mà thơi. Các mẫu DNA cịn lại (2-5) cĩ độ phức tạp tăng lên cho đến DNA bản sao đơn của người được tinh chiết, vốn cấu thành hầu hết bộ gene người và cĩ độ phức tạp của hơn một tỷ (>109) cặp base. 2. Ứng dụng trong lai phân tử Người ta lợi dụng khả năng nĩi trên của DNA để tạo ra các phân tử DNA lai nhân tạo bằng cách làm lạnh từ từ hỗn hợp các DNA biến tính từ hai lồi khác nhau. Kỹ thuật lai phân tử (molecular hybridization; Hình 3.17) này đã được ứng dụng rộng rãi để xác định mức độ tương đồng DNA của các nhĩm phân loại khác nhau. Trên nguyên tắc, nếu mức độ tương đồng càng lớn thì số lượng các đoạn lai càng lớn và ngược lại. Ví dụ, các thực nghiệm cho thấy cĩ khoảng 25% tổng số DNA người và chuột cĩ thể lai với
58 nhau (Watson et al 1987). Thơng thường mức độ lai được xác định bằng các phương pháp sắc ký hoặc ly tâm, trong đĩ một loại DNA được đánh dấu bằng đồng vị phĩng xạ. Hiện giờ các kỹ thuật này được áp dụng khá rộng rãi trong các nghiên cứu sinh học phân tử cũng như trong các lĩnh vực điều tra hình sự hoặc phát hiện sớm một số bệnh phân tử trước khi các triệu chứng xuất hiện để điều trị kịp thời. Biến tính / Hồi tính Lai hố Nucleic Acid Biến tính Hồi tính Lai hố của DNA của DNA DNA-RNA Chuỗi lai DNA-RNA Hình 3.17 Biến tính và hồi tính của DNA (trái) và lai nucleic acid. Gel Màng lọc bằng nylon Mẩu dị DNA Mẩu dị Trình tự đích Hình 3.18 Sơ đồ minh hoạ việc sử dụng mẫu dị DNA để tìm đoạn đích. Tĩm lại, theo nghĩa rộng, lai phân tử hay lai nucleic acid được
59 hiểu là sự tương tác giữa các sợi nucleic acid bổ sung. Nĩ cĩ thể xảy ra giữa hai sợi DNA, hoặc giữa các sợi DNA và RNA, hoặc giữa hai sợi RNA, và đĩ chính là cơ sở của nhiều kỹ thuật, chẳng hạn như: lai một mẫu dị cĩ đánh dấu đồng vị phĩng xạ (radioactive probe) để lọc ra DNA hay RNA bám vào màng lai là một trong những thí nghiệm cho nhiều thơng tin bổ ích nhất được tiến hành trong di truyền học phân tử. Hai kiểu cơ bản của lai phân tử là phương pháp lai Southern (Southern blots) và phương pháp lai Northern (Northern blots). Trong đĩ, kiểu đầu là lai bằng một mẩu dị để phát hiện, định lượng một phân tử DNA xác định; cịn kiểu sau dùng để phát hiện, định lượng một phân tử RNA. Mẫu dị (probe) là các cơng cụ sơ cấp được dùng để xác định các trình tự bổ sung cần quan tâm hay trình tự đích (target sequence). Đĩ là một nucleic acid sợi đơn thường được đánh dấu phĩng xạ và được dùng để xác định một trình tự nucleic acid bổ sung bám trên màng lọc nitrocellulose hay màng lai bằng nylon (Hình 3.18). V. Chức năng của DNA Ngày nay, chúng ta đều biết rõ rằng DNA hay bộ gene của tất cả các sinh vật nĩi chung cĩ chức năng chính là mang đầy đủ tồn bộ thơng tin di truyền (genetic information) đặc trưng cho từng lồi. Thơng tin di truyền này được ghi lại dưới dạng mật mã, gọi là mã di truyền (genetic code), và chứa đựng trong các gene cấu trúc (structural genes) cũng như các yếu tố kiểm sốt di truyền nhằm điều khiển mọi hoạt động sinh trưởng, phân chia và biệt hố của tế bào (chương 6). Hơn nữa, DNA hay vật chất di truyền nĩi chung đều cĩ khả năng tự sao chép một cách chính xác bản thân nĩ trong một quá trình gọi là tái bản (replication) - cơ sở của sự tự nhân đơi nhiễm sắc thể và, do đĩ, là cơ sở của sự phân chia tế bào (mà thực chất là sự phân chia hay truyền đạt vật chất di truyền; chương 5). Đĩ cịn là các quá trình hoạt động và điều hồ sự biểu hiện của các gene trong bộ gene - phiên mã (transcription) và dịch mã (translation) - tạo ra các phân tử (RNA và protein) tham gia vào các cấu trúc và hoạt động sống cơ sở của tế bào (chương 6). Nhờ đĩ mà con cái sinh ra thường giống với cha mẹ, mỗi lồi duy trì sự ổn định tương đối bộ gene của mình và, nĩi rộng ra là, nhờ đĩ mà sự sống được duy trì một cách liên tục kể từ khi sự sống bắt đầu hình thành trên trái đất cách đây chừng ba tỷ rưỡi năm. Mặt khác, DNA hay vật chất di truyền nĩi chung cĩ khả năng
60 phát sinh các biến đổi trong quá trình phát triển cá thể và sinh sản của sinh vật. Đĩ là các đột biến gene (gene mutations) gây ra bởi tác động của các tác nhân vật lý và hố học khác nhau, hoặc do chính các sai sĩt trong quá trình tái bản, hoặc do sự dịch chuyển vị trí của bản thân các gene trong bộ gene - các yếu tố di truyền vận động (transposable genetic elements) hay cịn gọi là các gene nhảy (jumping genes) - gây sự biến động của bộ gene và sự biến đổi ở kiểu hình. Ngồi ra, đĩ cịn là các quá trình tái tổ hợp di truyền (genetic recombination) tạo nên các biến dị tổ hợp phong phú và đa dạng trong quá trình sinh sản của sinh vật. Chính các quá trình biến đổi đa dạng này đã khơng ngừng tạo nên các nguồn biến dị di truyền sơ cấp và thứ cấp cho sự chọn lọc và tiến hố của sinh giới (chương 5). Các chức năng và cơ chế truyền đạt thơng tin di truyền chính yếu của DNA được mơ tả tĩm tắt như ở hình 3.19 dưới đây, và sẽ được thảo luận chi tiết trong các chương kế tiếp. Hình 3.19 Giáo lý trung tâm của sinh học phân tử. Nĩi chung, trong một bộ gene sinh vật cĩ chứa các thành phần chức năng khác nhau thuộc hai nhĩm chính sau đây: + Nhĩm thứ nhất bao gồm các gene, tức là các thành phần của bộ gene được biểu hiện thành các sản phẩm cuối cùng là RNA hay protein, đĩ là: (i) Các gene cấu trúc mã hố các RNA thơng tin, quy định các protein khác nhau, gọi là các gene mã hố protein (protein coding genes); (ii) Các gene mã hố các RNA vận chuyển; (iii) Các gene mã hố các RNA ribosome; (iv) Đối với các tế bào eukaryote, cịn cĩ các gene mã hố các RNA chức năng đặc trưng khác như: iRNA, snRNA, snoRNA, scRNA, gRNA, RNA của các enzyme
61 splicing và telomerase (xem chương 4). + Nhĩm thứ hai bao gồm các yếu tố khơng phải gene, tức là các thành phần của bộ gene khơng được biểu hiện thành các sản phẩm mà chỉ đĩng vai trị là các tín hiệu điều hồ hoặc kiểm sốt hoạt động của bộ gene hoặc các gene. Nhĩm này bao gồm nhiều vùng DNA đặc thù khác nhau, chẳng hạn: (i) Các trình tự điều hồ hoạt động tái bản, như: khởi điểm tái bản (origin of replication = ori) và kết thúc tái bản (terminator = ter); (ii) Các yếu tố kiểm sốt phiên mã, như: vùng khởi động (promoter region), yếu tố chỉ huy trong các operon ở prokaryote (operator, các yếu tố tăng cường (enhancer) hoặc yếu tố gây bất hoạt gene (silencer) ở eukaryote, ; (iii) Các yếu tố kiểm sốt dịch mã, ví dụ trình tự Shine-Dalgarno, hoặc các vùng khơng được dịch mã nằm trước và sau mRNA - sản phẩm gene mã hố protein - gọi là 5'-UTR và 3'-UTR; (iv) Các đoạn đệm giữa các gene (intergenic spacer); (v) Các intron - các đoạn khơng mã hố protein (phân bố xen kẻ với các đoạn mã hố gọi là các exon) của các gene phân đoạn ở eukaryote, ở các vi khuẩn cổ và một số virus lây nhiễm ở sinh vật bậc cao; (vi) Các gene giả (pseudogene); (vii) Các trình tự DNA lặp lại (repetitive DNA) khác nhau, kể cả các DNA tâm động (centromere) và DNA đầu mút (telomere) của các nhiễm sắc thể eukaryote; v.v. Như đã đề cập trước đây, trong khi mật độ phân bố các gene trong bộ gene của các prokaryote và các virus là hầu như dày đặc, thì ở các eukaryote mà đặc biệt là ở các sinh vật bậc cao, tỷ lệ này là tương đối nhỏ và thay vào đĩ, phần lớn bộ gene chứa các vùng DNA thuộc nhĩm thứ hai nĩi trên. Chẳng hạn, bộ gene người (human genome) cĩ các đặc điểm sau: (1) Bộ gene nhân (nuclear): - bộ gene đơn bội cĩ khoảng 3,2 tỷ cặp base; - chứa khoảng 20.000 - 25.000 gene, chiếm khoảng 2% tồn bộ bộ gene (số liệu ước tính mới nhất cơng bố từ tạp chí Nature ra ngày 21/10/2004; chỉ trước đĩ khơng lâu con số này là ~30.000 đến 40.000); - hầu hết các gene trong bộ gene đơn bội đều ở dạng các bản sao đơn; - các gene đều cĩ chứa từ 1 đến hơn 75 exon; - các gene sai khác nhau về chiều dài, biến thiên từ dưới 100