Przejdź do treści

Wypełnianie braków za pomocą uczenia maszynowego

Wizja artystyczna sondy kosmicznej Gaia.

Satelita Gaia wykonuje najdokładniejsze jak dotąd pomiary ruchu gwiazd. Konkretnie mierzy pozycje, prędkości i paralaksy gwiazd na całym niebie. Są to niezwykle przydatne informacje, ale nie dają one pełnego obrazu ruchu gwiazd. Na przykład, jak gwiazdy poruszają się wzdłuż naszej linii widzenia?

Nie na wszystkich wymiarach
Obecnie Gaia zwraca „astrometrię 5D” dla większości obserwowanych gwiazd, która składa się z dwóch współrzędnych położenia, dwóch prędkości i paralaksy. Na podstawie tych danych przeprowadzono już wiele badań naukowych, takich jak badanie pochodzenia strumieni gwiazd otaczających Drogę Mleczną.

Jednak większość astrometrii dostarczanej przez Gaię jest ograniczona do płaszczyzny nieba, co oznacza, że nie widzimy, jak gwiazdy poruszają się wzdłuż naszej linii widzenia – to znaczy, czy poruszają się w naszym kierunku, czy też oddalają od nas. To sprawia, że niektóre fascynujące nauki, takie jak mapowanie subtelnych struktur gwiazdowych i struktur ciemnej materii w Drodze Mlecznej, są poza zasięgiem. Badania spektroskopowe mogą dać nam prędkości w linii widzenia, ale są one czasochłonne i ograniczone objętością przestrzeni, którą mogą pokryć. Dodatkowo, niewiele badań spektroskopowych pokrywa się z obszarem obserwowanym przez Gaię.

Nie wszystko jest jednak stracone! Najnowsze badania przeprowadzone przez Adrianę Dropulic (Uniwersytet Princeton) pokazują, w jaki sposób uczenie maszynowe może być wykorzystane do przewidywania prędkości w linii prostej dla gwiazd w astrometrii 5D z Gai.

Trening sieci neuronowej
Aby rozwinąć swoją technikę uczenia maszynowego, Dropulic i jej współpracownicy zaczęli od publicznie dostępnego katalogu próbnych danych Gai, które zawierały prędkości w linii widzenia. Dodali również gwiazdy podobne do tych w Gaia-Enceladus, które pojawiają się, gdy wykreśla się prędkości. Katalog próbny obejmował przestrzeń w promieniu około pięciu kiloparseków (16 000 lat świetlnych) od Słońca i zawierał około 75 mln gwiazd. Katalog został następnie podzielony na zbiory treningowe, walidacyjne i testowe, z których pierwszy przyjmował prawdziwą próbkę Gai, zawierającą informacje o prędkościach w linii widzenia, czyli informacje „6D”.

Następnie Dropulic i współpracownicy wytrenowali sieć neuronową, aby przewidzieć prędkość danej gwiazdy w linii widzenia i związaną z nią przypadkowość. Ważnym zastrzeżeniem tej metody jest to, że nie ma ona na celu niemal idealnego odgadnięcia prędkości w linii widzenia dla pojedynczej gwiazdy. Celem jest raczej uzyskanie rozsądnego oszacowania rozkładu prędkości dla całej grupy gwiazd.

Przejście od próbnych danych
Zaletą posiadania danych wyjściowych sieci było to, że Dropulic i jej współpracownicy byli w stanie skonstruować rozkłady prędkości „próbkowane błędem”, które są tworzone przez uśrednienie wielu przewidywań prędkości i niepewności dla pojedynczej gwiazdy i powtórzenie dla całego rozkładu. Te rozkłady prędkości z próbkowaniem błędów okazały się bliższe rozkładom rzeczywistym niż rozkładom przewidywanym.

Następnym krokiem w tej pracy jest trenowanie sieci neuronowej na rzeczywistym katalogu danych Gai, a także zbadanie odleglejszych regionów Drogi Mlecznej. Nadchodzące trzecie wydanie danych z Gai będzie zawierało około 30 mln gwiazd z pełną astrometrią 6D, więc nie minie dużo czasu, zanim ta metoda uczenia maszynowego będzie mogła zostać wprowadzona w życie.

Opracowanie:
Agnieszka Nowak

Więcej informacji:

Źródło: AAS

Na ilustracji: Wizja artystyczna sondy kosmicznej Gaia. Źródło: ESA.

Reklama