Dịch tễ học hệ gene trong dịch COVID 19: Việt Nam cung cấp “vật liệu” cho thế giới
Dù chưa nhiều nhưng những đóng góp về thông tin giải trình tự gene virus SARS-CoV-2 của Việt Nam tại cơ sở dữ liệu GISAID không chỉ đem lại một mảng ghép không thể thiếu trên bản đồ lây truyền của loại virus này mà còn cho thấy tâm thế sẵn sàng cùng tham gia vào trận tuyến COVID-19 trên toàn cầu.
Vào ngày 6/4/2020, giáo sư Nông Văn Hải (Viện nghiên cứu Hệ Gene, Viện Hàn lâm KH&CN Việt Nam), một nhà nghiên cứu dày kinh nghiệm và từng thực hiện nhiều đề tài của Bộ KH&CN về hệ gene người Việt, hào hứng thông báo: trong số 3.443 trình tự hệ gene virus SARS-CoV-2 (hCoV-19) được đăng ký trên GISAID, Việt Nam đã đăng ký 8 trình tự gene với 6 từ Viện Vệ sinh dịch tễ Trung ương và 2 từ Viện Pasteur TP.HCM.
Với những người nghiên cứu về virus cúm, GISAID không phải là cái tên xa lạ, đây là dữ liệu chia sẻ về virus cúm có tốc độ nhanh nhất thế giới, bằng chứng là vào ngày 6/4/2020 mới có số 3.443 trình tự hệ gene virus được chia sẻ thì đến ngày 8/6/2020, con số này đã lên 4.896 trình tự gene. Là sự hợp tác công – tư giữa Chính phủ Đức và tổ chức NGO Friends of GISAID, nền tảng thông tin này đã cung cấp quyền truy cập tất cả các dữ liệu giải trình tự gene của các loại virus cúm và những dữ liệu lâm sàng và dịch tễ học liên quan. Nó bắt đầu được mở ra từ khi các nhà nghiên cứu nhận thấy sự nguy hiểm của mầm bệnh do virus cúm H5N1 gây ra khi truyền từ gia cầm sang người. Kể từ đó đến nay, GISAID đã trở thành nơi tin cậy của các nhà khoa học nghiên cứu về cúm trên khắp thế giới, trong đó có Việt Nam.
Vậy trình tự gene virus và chia sẻ dữ liệu này có ý nghĩa gì đối với công tác kiểm soát và ngăn ngừa bệnh dịch COVID-19, nhất là đối với Việt Nam, trong thời điểm vẫn còn nhiều nguy cơ rủi ro lây nhiễm trong cộng đồng?
Trong số gần 4.900 trình tự gene virus trên GISAID, những quốc gia phát triển về công nghệ gene hoặc chịu nhiều ảnh hưởng dịch bệnh như Mỹ, Australia, Pháp, Bỉ, Canada, Iceland, Hà Lan… đều đóng góp với vài trăm trình tự. Giữa số lượng đó, đóng góp của Việt Nam tuy chưa nhiều nhưng nó cũng đem lại một miếng ghép về biến đổi di truyền của virus trên lãnh thổ Việt Nam để các nhà nghiên cứu thế giới có thể so sánh, đối chiếu các vùng dễ biến đổi, vùng có khả năng tác động đến hệ miễn dịch của người bị nhiễm giữa các trình tự gene ở các địa điểm, thời gian khác nhau, qua đó giúp các nhà nghiên cứu lập được bản đồ phả hệ của virus.
Giúp trả lời những câu hỏi thiết yếu về đại dịch
Theo giáo sư Trương Nam Hải – nhà nghiên cứu di truyền và tin sinh học tại Viện Công nghệ sinh học (Viện Hàn lâm KH&CN Việt Nam), “hệ gene của virus SARS-CoV-2 không quá phức tạp so với hệ gene người và không lớn hơn 30.000 cặp base nucleotide (ký tự) nhưng những gì chúng ta biết về loại virus này vẫn chưa thực sự nhiều”,
Những hé lộ về bộ gene virus corona chủng mới cho thấy phần nào tầm quan trọng của những cơ sở dữ liệu như GISAID, nơi đăng tải kết quả giải trình tự gene virus đầu tiên trên thế giới của các nhà nghiên cứu Trung Quốc và được lấy làm trình tự tham chiếu cho các kết quả sau đó. Vì sao chúng ta cần trình tự hệ gene này? “Cũng như với hệ gene người, những thông tin mà chúng ta cần tìm hiểu về virus SARS-CoV-2 nằm trong chính hệ gene của nó”, một nhà sinh học phân tử trẻ học ở Đức giải thích. Một hệ gene – vật chất di truyền của một sinh vật sống, được ví như một cuốn sổ tài liệu thiết yếu, trong đó chứa đựng những thông tin cần thiết về sinh vật đó.
Vì vậy với một bộ “sưu tập” kết quả giải trình tự gene như ở GISAID, chúng ta có thể sử dụng các mô hình tiến hóa trình tự gene để kiểm chứng và dự đoán lịch sử phát triển của virus theo phạm vi không gian – nơi xuất hiện, con đường lây nhiễm…, cũng như theo quỹ đạo thời gian – quá khứ, hiện tại và tương lai; có thể sử dụng nó để trả lời cho những câu hỏi thiết yếu như “virus gây ra bệnh dịch thuộc loại nào, từ đâu ra?”, “các đột biến xuất hiện nhanh như thế nào?”, “nơi nào trong hệ gene này có những đột biến xuất hiện?”…
Việc phân tích kết quả giải trình tự gene còn mở ra cho chúng ra biết rất nhiều điều hữu ích khác, ví dụ “nhờ đó có thể thấy virus lan truyền như thế nào, tốc độ lan truyền tại các thời điểm và ước tính được số lượng người có thể bị nhiễm bệnh”, theo giáo sư Anne-Mieke Vandamme, KU Leuven (Bỉ). “Các giải trình tự gene hCoV-19 là yếu tố quan trọng để thiết kế và đánh giá các xét nghiệm chẩn đoán, để dò và truy dấu sự tiến triển của dịch bệnh cũng như nhận diện các lựa chọn can thiệp tiềm năng”.
“Mọi trình tự đều được so sánh với trình tự chuẩn do nhóm CDC Trung Quốc công bố đầu tiên để khẳng định có đột biến hay không? Hiện nay toàn bộ các trình tự (bao gồm các đột biến hay biến thể) tạm chia thành 3 nhánh (G, S và V clades) và chia nhỏ hơn thành các dòng nhánh (lineages), cho đến nay >10.
Tốc độ đột biến ngẫu nhiên bình thường cho Coronavirus nói chung là ~4-9×10*-4/nucleotides/năm, tức xấp xỉ 12 đến 28 nucleotides/năm. Số liệu cho đến hôm nay cho thấy tốc độ xấp xỉ 27 nucleotides/năm (tương đương xấp xỉ 2 nucleotides/tháng) là hoàn toàn bình thường.
Do đột biến hoàn toàn ngẫu nhiên, nên có thể xảy ra về mọi hướng (tốt hơn hay xấu hơn cho virus, độc hơn hay giảm độc lực đối với vật chủ…). Tuy nhiên, theo lý thuyết, nếu độc lực mạnh hơn đối với chủ gây tử vong nhanh, virus giảm cơ hội phát tán và cuối cùng virus sẽ biến mất.
Đáng chú ý, các trình tự từ Việt Nam chỉ có từ 0 đến vài điểm đột biến là hoàn toàn bình thường”.
GS. TS Nông Văn Hải, Viện Nghiên cứu Hệ Gene, Viện Hàn lâm KH&CN Việt Nam
Theo góc nhìn của giáo sư Trương Nam Hải và nhiều nhà di truyền học Việt Nam khác, dù nghiên cứu về virus SARS-CoV-2 không ngừng được thúc đẩy trên khắp các phòng thí nghiệm, nơi bệnh dịch đi qua, thì vẫn còn tồn tại nhiều khoảng trống hiểu biết về chủng virus mới này. Một trong những nguyên nhân quan trọng là vẫn còn nhiều thách thức trong khai thác thông tin từ những kết quả giải trình tự gene. Vì vậy, hiện nay các nhà nghiên cứu vẫn còn chưa xác định chính xác đâu là vật chủ trung gian của loài virus này từ một số giả thuyết như tê tê, dơi, cầy hương… Mặt khác, theo dấu di truyền mới chỉ là một khía cạnh bởi dịch bệnh lây lan còn phụ thuộc vào những hành vi, chuyển động… của người mang bệnh mà nếu kết luận vội vàng sẽ dẫn đến những hiểu nhầm đáng tiếc như trường hợp phát hiện ra sự tương đồng về hệ gene virus của một người Đức bị phát hiện nhiễm tại Ý vào tháng 2/2020 với một người bệnh ở Munich tháng trước. Nó dễ dẫn đến “kết luận giả” là nguồn gốc của dịch bệnh tại Ý có thể bắt nguồn từ Munich, tuy nhiên khi xem xét lại thì các nhà nghiên cứu thấy các virus này đều được “nhập khẩu” từ Trung Quốc tới mỗi quốc gia theo những con đường riêng rẽ.
Những đóng góp của Việt Nam
Gần 20 năm trước, khi dịch SARS xuất hiện ở bệnh viện Việt – Pháp (Hà Nội), các trang thiết bị phục vụ nghiên cứu về virus SARS-CoV, mầm bệnh gây ra bệnh dịch này, vẫn còn hết sức thiếu thốn. Trong một cuộc trao đổi vào tháng 3/2019, PGS. TS Nguyễn Lê Khánh Hằng – nhà nghiên cứu về virus cúm mùa tại Viện Vệ sinh dịch tễ Trung ương (Bộ Y tế), từng kể lại, khi đó, phòng thí nghiệm của Viện mới ở mức an toàn sinh học cấp 2, dành cho việc nghiên cứu về các tác nhân gây bệnh có khả năng gây bệnh cho người, động vật nhưng không trở thành mối nguy hiểm lớn cho cộng đồng. Sau dịch SARS và dịch cúm A H5N1 vào đầu những năm 2000, Viện Vệ sinh dịch tễ Trung ương và các Viện Pasteus thành viên bắt đầu được trang bị nhiều máy móc, thiết bị và nâng cấp cơ sở hạ tầng để có được phòng thí nghiệm an toàn sinh học cấp 3, nơi đủ điều kiện nghiên cứu tác nhân gây bệnh nặng cho người và động vật như vi khuẩn than, virus cúm A/H5N1, SARS…
Trong “làn sóng” đầu tư vào nguồn lực con người và cơ sở vật chất như vậy, nhiều cơ sở nghiên cứu đã có thêm nhiều máy móc thiết bị thiết yếu để nghiên cứu về sinh học phân tử, đặc biệt là máy giải trình tự gene thế hệ mới (NGS). Đây là những yếu tố cơ bản để các nhà nghiên cứu Việt Nam có thể tìm hiểu các phương thức kiểm soát và ngăn ngừa bùng phát COVID-19. Tương tự như trong lĩnh vực nghiên cứu về chất thải nhựa đại dương, COVID-19 cũng là một trong những cơ hội hiếm hoi mà các nhà nghiên cứu Việt Nam có thể cùng với đồng nghiệp trên toàn cầu “chạy đua với thời gian” và bước đầu có những kết quả tốt như nuôi cấy và phân lập được virus SARS-nCoV-2, phát triển bộ kit phát hiện virus dựa trên hướng dẫn của WHO…
Theo số liệu trên GISAID, đến ngày 8/4/2020, Việt Nam đã đóng góp trên cơ sở dữ liệu này 8 trình tự hệ gene, trong đó nhóm nghiên cứu do PGS. TS Lê Thị Quỳnh Mai (Phó viện trưởng Viện Vệ sinh dịch tễ Trung ương) dẫn dắt đã thực hiện được 5 trình tự. “Bản thân thông số này cũng phản ánh năng lực nghiên cứu của Viện, một trong những nơi đi đầu ở Việt Nam về virus cúm”, giáo sư Trương Nam Hải nói.
Vậy những điều này có thật sự ý nghĩa? “Ý nghĩa chứ, nó cho thấy sự sẵn sàng về năng lực và trang thiết bị để có thể thực hiện được những nhiệm vụ liên quan đến hệ gene của một cơ sở nghiên cứu”, giáo sư Trương Nam Hải nhận xét thêm.
Thông thường, để có được một kết quả giải trình tự hệ gene virus, nhà nghiên cứu sẽ phải phân lập mầm bệnh từ các bệnh nhân dương tính với virus, tách lấy vật liệu di truyền và bẻ gẫy nó đến kích thước có thể giải được trình tự trên máy (hiện tại, năng lực của các NGS là giải tối đa 600 cặp base). Sau một loạt các thao tác kỹ thuật khác để có được kết quả, họ sẽ phải lắp ráp các đoạn này thành một hệ gene hoàn chỉnh. “Với hệ gene người 3 tỷ cặp base nucleotide, ngay tới việc chạy máy cũng cần hai ba ngày thì với hệ gene virus cần ít thời gian hơn nhưng cũng phải tốn công”, một tiến sĩ di truyền học cho biết.
Vẫn cần phải làm tốt hơn
Nhiều nhà nghiên cứu cho rằng, so với năng lực hiện có, ít ra về khía cạnh thiết bị, số lượng 8 trình tự gene chia sẻ trên GISAID của Việt Nam có thể nhiều hơn. Bởi nếu theo kháo sát của TS. Đỗ Tấn Khang (Viện Nghiên cứu và Phát triển Công nghệ sinh học, ĐH Cần Thơ), năm 2018, Việt Nam có khoảng 25 máy giải trình tự gene thế hệ mới thì nay, theo một ước tính dựa trên quan sát và số lượng hóa chất vật tư chuyên dụng của một tiến sĩ di truyền học, hiện Việt Nam có không dưới 40 chiếc ở cả cơ sở nhà nước lẫn tư nhân.
Giáo sư Trương Nam Hải lý giải là có thể nhiều cơ sở nghiên cứu chưa có phòng thí nghiệm đạt tiêu chuẩn an toàn sinh học nên chưa đủ điều kiện tự phân lập mẫu, dù có đủ thiết bị và năng lực nghiên cứu. Dẫu vậy, một vài nhà di truyền học khác cho rằng, nếu các nơi có phòng thí nghiệm đạt tiêu chuẩn an toàn sinh học vì dành nhiều thời gian vào công việc phòng chống dịch thì có thể gửi mẫu tới các nơi có máy giải trình tự gene để kết hợp thực hiện. Về lâu dài, việc thực hiện những công việc mang tính kỹ thuật như thế này sẽ tạo điều kiện có được những mối quan hệ hợp tác để cùng nhau giải quyết những vấn đề nghiên cứu ở mức cao hơn.
Bốn hữu ích cơ bản từ việc trích rút thông tin hệ gene virus
1) Hiểu về lây truyền của virus Hiểu được những thay đổi trong trình tự của những hệ gene virus được thu thập từ những bệnh nhân khác nhau cho phép các nhà nghiên cứu xây dựng được “cây phả hệ” virus và đóng góp vào những nỗ lực giám sát sự lây lan của virus giữa những các cộng đồng theo thời gian. Điều này có thể giúp nhận diện được các “điểm nóng” lây nhiễm hoặc đối lượng siêu lây lan. Thông tin này có giá trị trong việc lên kế hoạch cho những can thiệp y tế công động để giảm thiểu bệnh dịch lây lan. 2) Thiết kế phương thức điều trị và vaccine 3) Giám sát sự tiến hóa của virus Việc liên tục dò theo tiến hóa của virus sẽ giúp các nhà khoa học thấy được những thay đổi di truyền có thể làm tăng hay giảm độc lực của các chủng virus. Việc cảnh báo sớm một virus tăng độc lực hoặc sự xuất hiện của kháng thể điều trị sẽ hỗ trợ các biện pháp giảm thiểu sự lây lan của bệnh dịch và cho tiết kế các phương thức điều trị và vaccine mới. 4) Chuẩn bị cho tương lai |