Hệ gen và sự phát sinh chủng loại của SARS-CoV2

A4-4

Bệnh viêm phổi cấp do SARS-CoV2
Đối với virus, việc giải mã hệ gen được quan tâm với các virus gây bệnh truyền nhiễm, như virus gây bệnh cúm, virus gây bệnh suy đường hô hấp cấp… ở người và động vật và một số virus gây thiệt hại lớn đối với cây trồng. Các thông tin về cấu trúc hệ gen virus là cơ sở xây dựng hệ thống phát sinh chủng loại, xác định quan hệ di truyền, truy tìm nguồn gốc, tìm kiếm gen kháng nguyên để nghiên cứu sản xuất vaccine, tìm kiếm thuốc ức chế virus …
Ví dụ bệnh viêm đường hô hấp cấp nặng do virus ở người là một hội chứng bệnh có căn nguyên do nhiều virus gây bệnh nguy hiểm, trong đó có bệnh SARS (Severe Acute Respiratory Syndrome) do virus SARS–Corona gây nên (SARS – CoV).
SARS – CoV là một biến thể của virus Corona, thuộc họ Coronaviridae và SARS – CoV có cấu trúc phân tử giống 60-70% với cấu trúc của Coronavirus kinh điển, tuy nhiên độc lực mạnh hơn rất nhiều lần, độc tố của SARS – CoV làm liệt cơ co bóp phế nang, hủy hoại mạnh tế bào đường hô hấp, gây rối loạn các enzyme chuyển hoá và làm ngộ độc các cơ quan nội tạng. Từ cuối tháng 2/2003 đến 8/2003, đại dịch SARS đã xảy ra tại 29 nước trên toàn cầu với tổng số 8.098 trường hợp mắc bệnh và 774 trường hợp tử vong. Bệnh SARS lây nhiễm từ người bệnh sang người và nguồn truyền nhiễm động vật hoang dã. Bệnh virus corona 2019 hay COVID-19 (Coronavirus disease 2019) hay đại dịch COVID-19, còn được gọi là đại dịch viêm phổi cấp do chủng mới của virus corona. Virus corona gây hội chứng hô hấp cấp tính nặng 2, viết tắt SARS-CoV-2 (Severe acute respiratory syndrome coronavirus 2), là một chủng coronavirus gây ra bệnh viêm đường hô hấp cấp do virus corona 2019 (COVID-19), xuất hiện lần đầu tiên vào tháng 12 năm 2019 ở thành phố Vũ Hán (Trung Quốc) và bắt đầu lây lan nhanh chóng sau đó, trở thành một đại dịch toàn cầu. Vào ngày 12 tháng 01 năm 2020, nó được Tổ chức Y tế Thế giới gọi tên là 2019-nCoV, dựa trên một phương thức đặt tên cho virus corona mới. Đến ngày 11 tháng 02 năm 2020, Ủy ban Quốc tế về Phân loại Virus (ICTV) quyết định đặt tên chính thức cho chủng virus corona mới này là SARS-CoV-2.
Hệ gen virus SARS-CoV2
Hệ gen của virus SARS-CoV-2 gồm các gen trên phân tử RNA sợi đơn có kích thước từ 27-32 kb (Hình 1), tương đồng 50% mã gen so với chủng virus MERS-CoV; 79,5% mã gen so với chủng virus SARS-CoV; 96% mã gen so với chủng virus Corona được phát hiện trong dơi, đặc biệt là dơi móng ngựa; 99% mã gen so với chủng virus Corona có trong loài Tê tê. Virus Corona SARS 2 và virus Corona SARS cùng thuộc virus Corona thế hệ B (Betacoronavirus Lineage B, Sarbecovirus). Hệ gen của SARS-CoV2 gồm các gen mã hóa 4 loại protein cấu trúc là S, M, N, và E. Protein spike (S) tạo thành các gai đặc trưng trong “vương miện” coronavirus. Các thành phần của protein S là kháng nguyên chính kích thích sinh kháng thể, protein M đóng vai trò quan trọng trong sự lắp ráp virus. Protein N (nucleocapsid) liên kết với hệ gen RNA để tạo thành nucleocapsid. Nó có thể tham gia vào quá trình điều hòa tổng hợp RNA của virus và có thể tương tác với protein M trong quá trình nảy chồi của virus. Protein E chưa rõ chức năng, nhưng trong SARS-CoV, protein E cùng với M và N là cần thiết để lắp ráp và giải phóng virus.

A3-3

Hình 1. Sơ đồ cấu trúc hệ gen của SARS-CoV2 
Tiến hóa phân tử của SARS-CoV2
Hệ gen của virus SARS-CoV2 có mã số MT192773, với kích thước 29890 bp do Nguyen và cs (2020), Viện Pasteur, Thành phố Hồ Chí Minh giải mã từ virus nhiễm ở người, trường hợp nhập khẩu đầu tiên của CoVid-19 tại Việt Nam. Một số trình tự hệ gen khác có kích thước khoảng từ 29 kb-30 kb. Đến tháng 4 năm 2020 đã có gần 3500 trình tự hệ gen của virus SARS-CoV2 được giải mã bởi các nhà khoa học của nhiều quốc gia trên thế giới, như Trung Quốc, Đức, Hoa Kỳ, Pháp, Việt Nam…. Đây là cơ sở phục vụ nghiên cứu sản xuất vaccine kháng SARS-CoV2, nghiên cứu phát sinh chủng loại và xác định vật trung gian truyền nhiễm. Nghiên cứu tiến hóa phân tử của SARS-CoV2, các nhà khoa học của NCBI đã thiết lập cây phát sinh chủng loại phân tử từ một trình tự nuleotide của hệ gen mang mã số trên GenBank. Ví dụ trình tự nucleotide đầy đủ của hệ gen mang mã số MT019532.1 của SARS-CoV2 gây Hội chứng hô hấp cấp tính nặng ở người phân lập từ người mắc bệnh ở Wuhan, Hubei, Trung quốc được đăng ký trên GenBank ngày 11 tháng 2 năm 2020, có kích thước 29890 do nhóm tác giả Ren và cs thuộc Phòng thí nghiệm trọng điểm NHC về Hệ thống mầm bệnh sinh học và Phòng thí nghiệm Christophe Merieux, Viện Sinh học mầm bệnh, Viện Hàn lâm Khoa học Y học & hiệp hội Y học Bắc Kinh, Trung Quốc. Trình tự hệ gen của SARS-CoV2 mang mã số MT123290.1 được đăng ký bởi Shi và cs, Trung tâm công nghệ, Quảng Châu, Trung quốc trên GenBank ngày 28 tháng 2 năm 2020 có 29891 bp và nhiều trình tự khác của SARS-CoV2. Hệ gen SARS-CoV2 chứa 4 gen mã hóa các protein S, E, M, N. Bằng BLAST trên NCBI xác định được 54 trình tự hệ gen đầy đủ có độ tương đồng gần 100% là SARS-CoV2. Cây phát sinh chủng loại dựa trên trình tự hệ gen SARS-CoV2 và các virus khác trên GenBank được thiết lập với sự khác biệt lớn hơn 75% bởi công cụ BLAST trên NCBI (https://blast.ncbi.nlm.nih.gov) dựa trên các hệ gen hoàn chỉnh của virus (Hình 2).

A1-1

Hình 2. Tiến hóa phân tử và mối quan hệ di truyền của SARS-CoV2 với các virus khác thiết lập dựa trên trình tự nucleotide hệ gen công bố trên GenBank theo phương pháp Neighbor Joining. Virus:54 là các virus SARS-CoV2 được khảo sát quan hệ tiến hóa phân tử, trong đó có SARS-CoV2 mang mã số MT019532.1 và MT123290.1. Các trình tự mang mã số MG772933, MG772934, MK211374, JX993988, KF294457, KF294455 là hệ gen của corona virus từ loài dơi ở Trung Quốc. Độ khác biệt là 0,009.              
Trên hình 2, cây phát sinh chủng loại được tạo ra bằng cách so sánh tương đồng theo từng cặp. BLAST căn chỉnh từng cặp giữa trình tự truy vấn (các trình hệ gen SARS-CoV2 như MT019532.1, MT123290.1 …) với các trình tự hệ gen trong cơ sở dữ liệu. Mẫu virus có trình tự hệ gen mang mã số MT019532.1 (hoặc MT123290.1) cùng 53 trình tự khác có cùng nguồn gốc với trình tự hệ gen của coronavirus giống như SARS ở loài dơi Trung Quốc mang mã số MG772933 và MG772934. SARS coronavirus (SARS-CoV), tác nhân gây ra dịch SARS lớn năm 2003, có nguồn gốc từ dơi. Nhiều loại coronavirus giống như SARS (SL-CoV) đã được phát hiện ở dơi, đặc biệt là những loài sống ở Trung Quốc, Châu Âu và Châu Phi (Hu và cs, 2018). Từ quan hệ tiến hóa trên cây phát sinh chủng loại này, một số nhà khoa học Truong Quốc đã giả thuyết rằng, dơi là động vật trung gian truyền SARS-CoV2.
Phân tích tiến hóa phân tử của SARS-CoV2, so với các chủng SARS-CoV1 và các chủng betacoronavirus giống SARS được chia thành hai nhánh, trong đó SARS-CoV2 và SARS-CoV1 mỗi chủng phân bố riêng ở một nhánh (Hình 3).
Phân tích tiến hóa của 3088 trình tự hệ gen virus SARS-CoV2 đến ngày 5/4/2020, thiết lập cây phát sinh chủng loại (Hình 3) cho thấy mối quan hệ tiến hóa của virus SARS-CoV2 (hCoV-19) từ đại dịch coronavirus COVID-19 xuất hiện đầu tiên từ Vũ Hán, Trung Quốc, vào tháng 11-12 / 2019, sau đó là sự lây nhiễm từ người sang người và đến thnga 4/2020 vẫn đang tiếp diễn. Các mẫu truyền được suy luận cụ thể chỉ là một giả thuyết. Cây phát sinh chủng loại bắt nguồn từ các mẫu đầu ở Vũ Hán (Trung Quốc). Độ phân giải tạm thời giả định tỷ lệ thay thế nucleotide là 8.10-4 mỗi nhánh/mỗi điểm/mỗi năm. Các dữ liệu được xử lý bằng Tin sinh học. Trên cây phát sinh chủng loại ở hình 6.9 cho thấy SARS-CoV2 đã phân thành hai nhánh lớn (A và B). Nhánh A đã chia ra 6 clade A1a, A2, A2a, A3, A6, A7 và nhánh B có 4 clade B, B1, B2, B4 (Hình 3).

A2-2

Hình 3. Cây tiến hóa phân tử của các chủng betacoronavirus giống SARS. Coronavirus SARS-CoV-2 từ đại dịch COVID-19 có màu đỏ, Coronavirus SARS-CoV-1 từ dịch SARS năm 2002-2003 có màu vàng và  Coronavirus giống như SARS có màu xanh lam.  (https://www.gisaid.org/epiflu-applications/next-hcov-19-app/)
Chu Hoàng Mậu
http://mysite.tnu.edu.vn/vi/chuhoangmau