Rozwój technologii sekwencjonowania trzeciej generacji otworzył nowe możliwości w analizie genomu i transkryptomu, jednocześnie stawiając przed naukowcami wyzwania związane z interpretacją ogromnych i złożonych zbiorów danych. Odpowiedzią na te potrzeby są algorytmy głębokiego uczenia, które coraz skuteczniej wspierają diagnostykę nowotworów oraz badania molekularne. Najnowszym przykładem są rozwiązania opracowane przez zespół z Uniwersytetu w Hongkongu, które mogą istotnie zmienić praktykę kliniczną i badawczą.
Z tego artykułu dowiesz się…
- Jak algorytmy głębokiego uczenia usprawniają wykrywanie mutacji w nowotworach i dlaczego ma to znaczenie kliniczne.
- Na czym polega przełom ClairS-TO, który umożliwia analizę DNA guza bez próbki zdrowej tkanki.
- Jak Clair3-RNA zmienia analizę sekwencjonowania RNA, pozwalając odróżnić prawdziwe mutacje od szumu biologicznego.
- Dlaczego rozwiązania z serii Clair przyspieszają rozwój medycyny precyzyjnej i genomiki klinicznej.
Przełomowe algorytmy z Uniwersytetu w Hongkongu
Naukowcy z Wydziału Inżynierii Uniwersytet w Hongkongu (HKU) zaprezentowali dwa innowacyjne algorytmy głębokiego uczenia: ClairS-TO oraz Clair3-RNA. Zespół badawczy, kierowany przez prof. Ruibang Luo z Wydziału Informatyki i Nauki o Danych, skoncentrował się na usprawnieniu wykrywania mutacji genetycznych w nowotworach oraz na analizie danych RNA pochodzących z sekwencjonowania długich odczytów. Wyniki prac zostały opublikowane w prestiżowym czasopiśmie Nature Communications.
Sekwencjonowanie długich odczytów – potencjał i ograniczenia
Technologie sekwencjonowania długich odczytów umożliwiają rejestrowanie ciągłych fragmentów DNA i RNA, zapewniając znacznie pełniejszy obraz informacji genetycznej niż metody krótkich odczytów. Pozwalają one identyfikować złożone warianty strukturalne, mutacje somatyczne oraz zmiany w ekspresji genów.
Jednocześnie interpretacja takich danych pozostaje trudna. Wysoki poziom szumu technicznego, błędy sekwencjonowania oraz procesy biologiczne, takie jak edycja RNA, mogą maskować rzeczywiste mutacje. To właśnie w tym obszarze algorytmy oparte na głębokim uczeniu zyskują kluczowe znaczenie.
ClairS-TO – diagnostyka nowotworów bez próbki referencyjnej
ClairS-TO odpowiada na jedno z największych wyzwań diagnostyki onkologicznej: analizę DNA guza w sytuacji, gdy nie jest dostępna próbka zdrowej tkanki pacjenta. Standardowe podejścia wymagają porównania materiału nowotworowego z próbką referencyjną, co w praktyce klinicznej bywa niemożliwe lub kosztowne.
Nowy algorytm wykorzystuje architekturę opartą na dwóch sieciach neuronowych – jedna z nich potwierdza autentyczne mutacje, druga eliminuje błędy sekwencjonowania. Takie podejście umożliwia wiarygodne wykrywanie mutacji somatycznych wyłącznie na podstawie materiału guza. W efekcie analiza staje się bardziej dostępna, szybsza i tańsza, nawet przy ograniczonej ilości materiału biologicznego.
Clair3-RNA – precyzyjna analiza wariantów w RNA
Drugim rozwiązaniem jest Clair3-RNA, określany jako pierwszy na świecie system rozpoznawania małych wariantów oparty na głębokim uczeniu, zaprojektowany specjalnie do sekwencjonowania długich odczytów RNA. W analizie transkryptomu szczególnym problemem pozostaje rozróżnienie pomiędzy rzeczywistymi mutacjami, edycją RNA a błędami technicznymi.
Clair3-RNA wykorzystuje zaawansowane modele uczenia głębokiego do precyzyjnej separacji sygnału biologicznego od szumu. Dzięki temu możliwa staje się jednoczesna analiza ekspresji genów i wariantów genetycznych z wysoką dokładnością, co ma kluczowe znaczenie zarówno w badaniach podstawowych, jak i w diagnostyce klinicznej.
Seria Clair jako standard w biologii obliczeniowej
Nowe algorytmy stanowią kolejne rozszerzenie znanej serii Clair – pakietu narzędzi genomicznych opartych na sztucznej inteligencji, rozwijanego przez zespół prof. Luo. Wcześniejsze rozwiązania, w tym Clair3, stały się standardem branżowym w analizie danych z sekwencjonowania trzeciej generacji.
Algorytmy te, udostępniane w modelu open source, zgromadziły już ponad 400 tysięcy pobrań i są wykorzystywane przez wiodące instytuty badawcze oraz firmy sekwencjonujące na całym świecie. Ich popularność wynika z połączenia wysokiej dokładności, szybkości działania i odporności na błędy danych wejściowych.
Znaczenie dla medycyny precyzyjnej i badań klinicznych
Komentując znaczenie nowych narzędzi, prof. Ruibang Luo podkreślił:
ClairS-TO i Clair3-RNA, wraz z innymi algorytmami z serii Clair, stworzyły solidne podstawy do odkrywania mutacji genetycznych przy użyciu głębokiego uczenia się i przyspieszyły wdrażanie medycyny precyzyjnej i genomiki klinicznej.
Zastosowanie tych algorytmów może usprawnić diagnostykę nowotworów, umożliwić bardziej precyzyjne dopasowanie terapii do profilu molekularnego choroby oraz przyspieszyć odkrycia w genomice i transkryptomice. W dłuższej perspektywie oznacza to realne korzyści zarówno dla pacjentów, jak i dla systemów ochrony zdrowia.
Główne wnioski
- Algorytmy ClairS-TO i Clair3-RNA, opracowane na Uniwersytecie w Hongkongu, znacząco zwiększają dokładność wykrywania mutacji w danych z sekwencjonowania długich odczytów.
- ClairS-TO umożliwia wiarygodną analizę mutacji nowotworowych bez konieczności porównywania próbki guza z materiałem zdrowej tkanki.
- Clair3-RNA jako pierwszy system tego typu pozwala jednocześnie analizować ekspresję genów i małe warianty genetyczne w RNA, eliminując wpływ edycji RNA i błędów technicznych.
- Rozwiązania z serii Clair, pobrane ponad 400 tys. razy, stanowią jeden z filarów nowoczesnej biologii obliczeniowej i przyspieszają wdrażanie medycyny precyzyjnej.
Źródło:
- The University of Hong Kong
- https://www.nature.com/articles/s41467-025-64547-z
- https://www.nature.com/articles/s41467-025-67237-y

