Các nhà khoa học giới thiệu pangenome con người đầu tiên: một tầm nhìn mới trong di truyền học.

Các nhà khoa học vừa công bố bộ gen pangen đầu tiên của con người, là kết quả của việc kết hợp bộ gen của 47 cá thể từ khắp nơi trên thế giới. Tài liệu tham khảo này mang tính cách mạng, cung cấp sự hiểu biết vô song về sự phức tạp của sự đa dạng di truyền của con người. Bằng cách bổ sung 119 triệu cơ sở DNA, bộ gen pangen vượt ra ngoài giới hạn của một bộ gen tham chiếu duy nhất. Trong quá trình này, pangenome mang lại độ chính xác, tính hoàn thiện vô song và quan trọng nhất là khả năng đáng kinh ngạc để tiết lộ các biến thể di truyền mà trước đây chúng ta không nắm bắt được. Cuộc cách mạng bộ gen người này hứa hẹn định hình lại cảnh quan bộ gen và cung cấp những hiểu biết sâu sắc về di sản chung của loài người.
Bộ gen của con người lần đầu tiên được giải trình tự vào năm 2003, ảnh hưởng lớn đến di truyền học và nghiên cứu sinh học kể từ đó. Nhưng bất chấp những bước nhảy vọt trong hiểu biết của chúng ta về bản thiết kế loài người, những nỗ lực ban đầu này vẫn chưa hoàn thiện. Phải đến năm 2022, các nhà khoa học mới lấp đầy khoảng trống và giải trình tự bộ gen hoàn chỉnh của con người — và chúng ta vẫn chưa hoàn thành.
Giờ đây, một nhóm các nhà khoa học đã một lần nữa nâng tầm bằng cách công bố “bộ gen pangen” đầu tiên của con người, kết hợp bộ gen của 47 cá thể từ khắp nơi trên thế giới.
Bằng cách kết hợp vật liệu di truyền của 47 cá nhân từ các nguồn gốc tổ tiên khác nhau, tài liệu tham khảo mang tính cách mạng này cung cấp sự hiểu biết vô song về sự phức tạp của sự đa dạng di truyền của con người.
Trong một loạt các bài báo đáng chú ý được xuất bản ngày hôm nay trên một tạp chí khoa học có uy tín, bước đột phá thay đổi cuộc chơi này hứa hẹn sẽ định hình lại cảnh quan bộ gen, cung cấp những hiểu biết sâu sắc về di sản chung của loài người.
nội dung
- 1 Làm sáng tỏ những bí mật của sự đa dạng di truyền: Cuộc cách mạng bộ gen người
- 2 Biên giới bộ gen mới được tiết lộ
- 3 Lập bản đồ con đường đến di sản
- 4 Dệt thảm với độ chính xác
Làm sáng tỏ những bí mật của sự đa dạng di truyền: Cuộc cách mạng bộ gen người

Mặc dù 99,9% bộ gen giống nhau từ người này sang người khác, nhưng có rất nhiều sự đa dạng được tìm thấy trong 0,1% cuối cùng đó. Ngay cả với bộ gen hoàn chỉnh của con người được các nhà khoa học công bố vào năm ngoái, 70% trình tự mà các nhà khoa học sử dụng để đánh giá biến thể di truyền vẫn đến từ một người.
Không cần phải nói, đây là một vấn đề cho nghiên cứu di truyền. Hạn chế này dẫn đến một hiện tượng được gọi là sai lệch tham chiếu, cản trở khả năng phân tích toàn diện bộ gen của chúng ta.
Nhập pangenome. Không giống như những người tiền nhiệm của nó, pangenome bao hàm sự đa dạng và toàn diện, kết hợp bộ gen của 47 cá thể từ các nguồn gốc tổ tiên khác nhau.
Hình dung nó như một tấm thảm về sự biến đổi của con người, trong đó các trình tự di truyền phổ biến hình thành nên những con đường trơn tru trong khi các vùng khác nhau bộc lộ dấu ấn di truyền độc nhất của các quần thể khác nhau.
Với việc bổ sung 119 triệu cơ sở DNA—các “chữ cái” cơ bản tạo nên mã di truyền của chúng ta—bộ gen pangen vượt ra ngoài giới hạn của một bộ gen tham chiếu duy nhất.
Trong quá trình này, pangenome mang lại độ chính xác, tính hoàn thiện vô song và quan trọng nhất là khả năng đáng kinh ngạc để tiết lộ các biến thể di truyền mà trước đây chúng ta không nắm bắt được.
Biên giới bộ gen mới được tiết lộ
Biến thể bộ gen có nhiều dạng—từ sự khác biệt tinh tế trong các cơ sở DNA riêng lẻ đến các biến thể cấu trúc lớn hơn bao gồm 50 cặp cơ sở trở lên. Những biến thể cấu trúc này có thể có ảnh hưởng sâu sắc đến sức khỏe của chúng ta.
Tuy nhiên, cho đến nay, khả năng của chúng tôi để xác định chúng là rất hạn chế. Chỉ 30% các biến thể cấu trúc này có thể được phát hiện với công nghệ hiện tại và các hạn chế của một bộ gen tham chiếu duy nhất.
Trong số 119 triệu base mới được thêm vào pangenome, khoảng 90 triệu base đến từ biến thể cấu trúc. Chúng bao gồm đảo ngược, chèn, xóa và lặp lại song song (các đoạn vật liệu di truyền được lặp lại nhiều lần).
Các cơ sở bổ sung này mở ra cơ hội cho các vùng chưa được lập bản đồ của bộ gen, làm sáng tỏ các vùng chưa được kiểm chứng trước đó và có khả năng phát hiện ra mối liên hệ giữa các biến thể cấu trúc và các bệnh như tự kỷ, tâm thần phân liệt, rối loạn miễn dịch và bệnh tim mạch vành.
Ý nghĩa của thành công này vượt ra ngoài các biến thể cấu trúc. Khi xác định các biến thể di truyền nhỏ hơn, chẳng hạn như thay đổi cơ sở đơn lẻ, pangenome vượt trội so với phiên bản tiền nhiệm với độ chính xác tăng 34%.
Bằng cách tận dụng lượng dữ liệu khổng lồ có sẵn trong pangenome, giờ đây các nhà khoa học có thể khám phá những biến thể nhỏ này với độ chính xác vô song.
Lập bản đồ con đường đến di sản
Bên trong mỗi chúng ta là một cặp nhiễm sắc thể—một nhiễm sắc thể thừa hưởng từ mẹ, nhiễm sắc thể kia thừa hưởng từ cha. Pangenome hiện đang giúp các nhà khoa học làm sáng tỏ mạng lưới di truyền phức tạp này.
Với sức mạnh của độ phân giải haplotype, pangenome tự tin phân biệt giữa hai bộ nhiễm sắc thể của bố mẹ, một điều mà trước đây rất khó khăn—một thành tựu khoa học đáng chú ý. Kiến thức mới này trao quyền cho các nhà khoa học nghiên cứu sâu hơn về những bí ẩn của sự di truyền gen và vai trò của nó đối với các bệnh khác nhau.
Điều này cũng có nghĩa là bộ gen pangen không chỉ bao gồm một mà là 94 trình tự bộ gen đáng kinh ngạc. Và cuộc hành trình không kết thúc ở đó. Đến năm 2024, các nhà nghiên cứu có kế hoạch mở rộng bộ sưu tập này để bao gồm 700 bộ gen tham chiếu, bao gồm nhiều loại đa dạng di truyền của con người hơn.
Dệt thảm với độ chính xác
Đằng sau hậu trường, một bản giao hưởng của các kỹ thuật tính toán và thuật toán tiên tiến đã đưa pangenome vào cuộc sống thông qua Human Pangenome Reference Consortium (HPRC). Hàng chục nhà nghiên cứu từ nhiều tổ chức trên khắp Hoa Kỳ, Vương quốc Anh và Đức đã tham gia vào thành tựu quan trọng này.
Ví dụ, phòng thí nghiệm bộ gen tính toán của UC Santa Cruz, do Benedict Paten đứng đầu, đã dẫn đầu việc phát triển các phương pháp tiên tiến để sắp xếp nhiều trình tự bộ gen thành một cấu trúc thống nhất—một biểu đồ bộ gen phức tạp. Trong biểu đồ này, các con đường được chia sẻ đại diện cho các khu vực giống nhau, trong khi các con đường khác nhau làm nổi bật các khu vực biến thể di truyền.
Con đường này được thiết kế cẩn thận, đảm bảo rằng mỗi bộ gen trong tham chiếu bộ gen đạt được chất lượng và độ chính xác vượt trội.
“Dự thảo bộ gen pangen là một bằng chứng quan trọng về nguyên tắc mà chúng tôi hy vọng sẽ ảnh hưởng đến nhiều người và khiến họ suy nghĩ về bộ gen và cách nó có thể ảnh hưởng đến công việc của họ,” Paten nói.
“Trong tương lai, chúng tôi nhận thấy rất nhiều sự tương tác với các nhóm khác—cần rất nhiều người khác nhau để xây dựng thứ gì đó sẽ trở thành nguồn tài nguyên cộng đồng khổng lồ.”
Tất cả 47 bộ gen lưỡng bội được lấy từ các tình nguyện viên tham gia Dự án 1000 bộ gen (1000G) và đồng ý chia sẻ trình tự gen ẩn danh của họ trong cơ sở dữ liệu có sẵn công khai. Các mẫu được đồng ý công khai này—có nguồn gốc từ nhiều nền tảng khác nhau—mở đường cho quyền truy cập không giới hạn vào nguồn tài nguyên vô giá này mà không có các rào cản về quyền riêng tư thường đi kèm với nghiên cứu bộ gen.
Chắc chắn, đây chỉ là sự khởi đầu.
Nhìn chung, bằng cách kết hợp bộ gen của hàng chục cá thể từ khắp nơi trên thế giới, bộ gen pangen cung cấp nguồn dữ liệu phong phú hơn nhiều so với bộ gen tham chiếu ban đầu.
Paten, tác giả chính của bài báo mang tính bước ngoặt cho biết: “Chúng tôi đang giới thiệu sự đa dạng và công bằng hơn vào tài liệu tham khảo bằng cách lấy một mẫu người đa dạng và đưa họ vào cấu trúc này mà mọi người đều có thể sử dụng”. “Một bộ gen là không đủ để đại diện cho tất cả mọi người—bộ gen cuối cùng sẽ là một thứ bao hàm và đại diện.”
Những phát hiện mới được mô tả trong bốn bài báo riêng biệt được công bố hôm nay trên tạp chí nghiên cứu bộ gen, thiên nhiên, Công nghệ sinh học tự nhiênVà Phương pháp tự nhiên.
- Benedict Paten và cộng sự, Dự thảo tham chiếu bộ gen người, Công nghệ sinh học tự nhiên (2023). DOI: 10.1038/s41586-023-05896-x. www.nature.com/articles/s41586-023-05896-x
- Vollger et al, Tăng tỷ lệ đột biến và chuyển đổi gen trong các bản sao phân đoạn của con người, thiên nhiên (2023). DOI: 10.1038/s41586-023-05895-y
- Guarracino et al, Sự tái tổ hợp giữa các nhiễm sắc thể dị hợp của con người, thiên nhiên (2023). DOI: 10.1038/s41586-023-05976-y
- Hickey et al, xây dựng đồ thị Pangenome từ sự sắp xếp bộ gen với xương rồng-minigraphs, Công nghệ sinh học tự nhiên (2023). DOI: 10.1038/s41587-023-01793-w