Hackathon 2.0 – projekty

  1. [IFD FUW] Downsampling bardzo wąskich sygnałów w celu wydajnej wizualizacji przebiegów
    Rysowanie wykresów z danych doświadczalnych jest szybkie i przyjemne pod warunkiem, że liczba punktów nie jest zbyt duża. W eksperymentach z detektorem OTPC1 rejestrujemy przebiegi czasowe trwające ok. 1 sekundę z częstotliwością próbkowania 50 MHz, co daje ok. 50 milionów punktów pomiarowych na jeden przebieg. Taka liczba punktów wyświetlana naraz zarówno obciąża pamięć RAM, jak i znacznie spowalnia operacje na wykresie takie jak skalowanie czy przesuwanie, co czyni pracę z danymi mało wydajną i jeszcze mniej przyjemną. Najprostszym remedium jest zmniejszenie częstotliwości próbkowania wyświetlanego przebiegu. Problem polega na tym, że najważniejszą informacją w naszych danych są sygnały o szerokości 1-10 us. Wyświetlanie co setnego punktu spowoduje utratę części tych sygnałów, które były za wąskie i nie ‘trafiły’ w punkt wzięty do wykresu. Wyświetlanie co dziesiątego punktu z kolei nie poprawia za wiele wydajności. Uśrednianie punktów z przedziałów wydaje się lepszym wyjściem, ale za duże obszary uśredniania też powodują utratę sygnału. Potrzebne jest inne rozwiązanie.
    Zadaniem drużyny będzie zaprogramowanie algorytmu stosującego downsampling w taki sposób, aby nie tracić sygnałów mikrosekundowych pików, ale jednocześnie poważnie zredukować liczbę wyświetlanych punktów (powiedzmy 1000 razy).
    Przykładowe obrazki i przykłady przebiegów:  http://www.fuw.edu.pl/~pfutzner/Research/OTPC/OTPC.html

  2. [IFJ, IFD FUW] Automatyzacja analizy obrazów pochodzących z detektora OTPC
    Badanie egzotycznych kanałów rozpadów jądrowych wymaga zastosowania specjalistycznych narzędzi. Jednym z takich narzędzi jest powstała w Instytucie Fizyki Doświadczalnej Uniwersytetu Warszawskiego komora Optical Time Projection Chamber, w skrócie OTPC. Zastosowanie tej techniki pomiarowej pozwala na obserwację emisji cząstek naładowanych z nuklidów dalekich od stabilności. W typowym zestawie danych pochodzących z eksperymentu z wykorzystaniem OTPC znajdują się zdjęcia wykonane kamerą CCD. Zadanie polegałoby na napisaniu programu, który, wykorzystując techniki uczenia maszynowego (metody bez nadzoru), potrafiłby automatycznie klasyfikować zdjęcia do następujących grup:
    – zdjęcie puste
    – zdjęcie na którym znajdują się tylko jony
    – zdjęcie na którym znajdują się jony + produkty rozpadu, przy czym osobno należałoby zaklasyfikować przypadki, w których występuje dana liczba produktów rozpadu (standardowo może być to jedna, dwie lub trzy cząstki). Dodatkowym atutem będzie zapis położenia początku i końca trajektorii wszystkich jonów i emitowanych cząstek.
    Działający program może przyczynić się do odkrycia nowych, do tej pory nie obserwowanych, kanałów rozpadów jąder egzotycznych.

  3. [Firma Elettric80] Optymalizacja ścieżek autonomicznych wózków widłowych
    W obecnych czasach fabryki pracujące bez udziału człowieka stają się coraz bardziej powszechne. Od taśm transportujących i robotów, poprzez wózki przenoszące gotowe produkty, do samozarządzających sobą magazynów. Nasze wózki widłowe są w stanie śledzić swoją pozycję w fabryce z dokładnością do kilku centymetrów i potrafią podążać zaprojektowaną wcześniej przez człowieka ścieżką trzymaną w ich pamięci. Taka linia składa się z punktów określających specjalne pozycje w fabryce, przy których wózki mogą wykonywać operacje, oraz łączących ich linii. Linie przechodzą w siebie płynnie aby wózek nie wykonywał gwałtownych ruchów czy ostrych zakrętów.
    Zadanie polega na opracowaniu programu, w którym będzie można wgrać plik .dxf przedstawiający uproszczony schemat fabryki z zaznaczonymi punktami omówionymi powyżej. Program powinien znaleźć ścieżki łączące te punkty z uwzględnieniem promieni skrętu wózków jak również ich rozmiarów.
    Zadanie będzie zakończone powodzeniem, jeśli dla kilku plików wejściowych wygeneruje schemat ścieżek, które następnie zostaną porównane z wynikami oczekiwanymi.
    Zadanie będzie zakończone częściowo, jeśli ścieżki zostaną prawidłowo wygenerowane, ale będą miały braki wymagające usprawnienia (np. za ostre zakręty, nie uwzględnienie rozmiaru wózka, za dużo zakrętów, itd.).
    Zadanie nie wymaga dodatkowych umiejętności z zakresu robotyki czy automatyki.  Znajomość AutoCAD czy algorytmów poszukiwania ścieżek będzie pomocna przy pracy nad zadaniem, ale nie obowiązkowa.

  4. [FUW] Kompletna baza publikacji naukowych pracowników Wydziału Fizyki wraz ze wstępną analizą
    Celem zadania jest stworzenie bazy danych, zawierającej szczegółowe informacje dotyczące publikacji naukowych stworzonych na naszym Wydziale. Chociaż bazy tego typu są istotnym narzędziem pracy Biura Obsługi Badań, okazuje się, że narzędzia dostępne do ich tworzenia i analizy nie spełniają wszystkich wymagań. Pierwsza część zadania polega na stworzeniu narzędzi do automatycznego połączenia informacji dostępnych w internetowych bazach danych oraz zintegrowaniu ich z internetowymi narzędziami bibliograficznymi (przez dostępne API). Druga część zadania polega na zbadaniu stworzonej bazy danych. Z punktu widzenia Wydziału Fizyki, szczególnie interesujące będą statystyki liczby publikacji dla jednostek organizacyjnych i dziedzin fizyki. Następnym zadaniem jest zaproponowanie metody prezentacji danych zgromadzonych w bazie. Szczególnie cenne będzie zaproponowanie metody klastrowania publikacji naukowych oraz zbadanie Wydziałowej “sieci współautorstwa” między autorami publikacji.

  5. [IFT FUW, CENT UW] Dziwne wzorce w genomach bakterii
    Tzw. SIDD (ang. Stress Induced Duplex Destabilization index) to parametr szacujący tendencję DNA do spontanicznego rozwijania podwójnej helisy. Jego wartość można obliczyć teoretycznie i pozwala ona wraz z sekwencją DNA zidentyfikować obszary genomu które ulegają transkrypcji (obszary kodujące białka i funkcjonalne RNA — tRNA, rybosomy) i odróżnić je od obszarów międzygenowych. Te ostatnie wykazują większą niż przeciętna tendencję do spontanicznego rozwijania co ułatwia inicjację procesu
    transkrypcji DNA na RNA. Zauważyliśmy że w indeksie SIDD genomów bakteryjnych istnieją obszary anomalne, gdzie nie wykazuje on typowego zachowania i chcielibyśmy zrozumieć ich funkcję.
    Celem zadania jest stworzenie, przy zastosowaniu metod uczenia maszynowego, klasyfikatora umożliwiającego wyróżnienie w obliczonym SIDD obszarów “normalnych” i “anomalnych”.

  6. [KMUZ, IFT FUW] Agate evolver
    Agaty to minerały złożone z mikrokrystalicznej krzemionki ułożonej w charakterystyczne warstwy. Agaty wypełniają zwykle pustki po pęcherzach gazowych uwięzionych w stygnącej lawie. Jedna z teorii ich powstawania mówi, że kolejne warstwy krzemionki osadzały się na ściankach takiej pustki, a kolorowe paski są odzwierciedleniem różnych w składzie chemicznym roztworu na przestrzeni setek tysięcy lat, w czasie których tworzył się agat.
    W zadaniu spróbujemy znaleźć kształty poszczególnych warstw agatu zakładając, że wzrost (w kierunku od ścianek do środka buły agatowej) odbywa się ze stałą prędkością (czyli nowa warstwa składa się z punktów będących w ustalonej odległości od warstwy poprzedniej). Taki wzrost ma naturalną tendencję do generowania „ostrych kantów”, jak zilustrowano na rysunku, gdzie pierwsza warstwa miała postać sinusoidalną. Takie punkty z nieciągłą pochodną są często widoczne w agatach, co jest argumentem za tym, że ten prosty model wzrostu może być w tym przypadku właściwy. Końcowym efektem naszej pracy będzie agate evolver, który wyprodukuje strukturę warstw dla danej początkowej geometrii agatu w dwóch i trzech wymiarach. Spróbujemy też przetestować go na rzeczywistych agatach, aby sprawdzić, czy numerycznie wygenerowana struktura pasm pokrywa się z rzeczywistą.

  7. [ZB, IFD FUW] Poszukiwanie motywów strukturalnych enzymów trawiących plastik
    Enzymy zdolne do rozkładu plastiku, ze względu na swoje unikalne właściwości, są obecnie pilnie studiowane przez grupy realizujące projekty związane z ochroną środowiska i biotechnologicznym recyclingu materiałów.
    Zadanie będzie polegało na wykorzystaniu narzędzia do wykrywania i porównywania lokalnych motywów strukturalnych do znalezienia w bazach znanych enzymów białek z motywami strukturalnie podobnymi do centrum enzymatycznego PETazy.
    W następnym kroku interesujące będzie zidentyfikowanie struktury wspólnego rdzenia i scharakteryzowanie różnic w obrębie tej struktury między enzymami zdolnymi do trawienia polietylenu i pozostałymi, podobnymi do niego strukturalnie.
    Efektem pracy zespołu będzie skrypt pozwalający na wykrycie wspólnego rdzenia w strukturach z bazy PDB podobnych do inputowej struktury.
    Narzędzia wykorzystywane w czasie realizacji projektu opierają się na deskryptora lokalnej struktury (DLS) biopolimerów. W myśl tego podejścia poszczególne mery biopolimeru charakteryzuje się opisując ich otoczenie fizykochemicznym. Przy porównywaniu i analizowaniu struktur biopolimery dzieli się na mniejsze elementy odpowiadające otoczeniu fizykochemicznemu (DLS), a następnie analizuje się relacje między zachodzącymi na siebie DLS-ami.
    Osoby realizujące projekt będą miały szansę zapoznać się z narzędziami implementującymi podejście deskryptorowe przy porównywaniu struktur i poszukiwaniu motywów strukturalnych: DAMA oraz DEDAL, a także z biblioteką klas języka Python — PyDesc.
    Mile widziana znajomość bibliotek pandas, matplotlib oraz numpy.

  8. [ZB, IFD FUW] Wieloskalowa metoda do symulowania dużych zmian konformacyjnych w biopolimerach
    Białka i kwasy nukleinowe — biopolimery — są substancjami, których dynamika decyduje o niektórych właściwościach życia. Znane są nam statyczne struktury wielu białek i kwasów nukleinowych, jednak do prowadzenia wielu badań konieczna jest znajomość dynamiki ich struktur. Dostępne narzędzia wykorzystują dokładne ale wymagające obliczeniowo algorytmy, lub szybkie, ale możliwe do zastosowania jedynie w ograniczonej liczbie przypadków. Stworzenie narzędzi wpasowujących się w tę lukę może okazać się znaczącym ułatwieniem dla badaczy.
    Projekt obejmuje stworzenie modułowego narzędzia symulującego zmiany konformacyjne zachodzące w strukturach biopolimerów z wykorzystaniem technik Monte Carlo (MC), ukrytych łańcuchów Markova (HMM), deskryptorów lokalnej struktury (DLS) oraz sterowanej dynamiki molekularnej.
    Efektem pracy zespołu będzie narzędzie pozwalające na wygenerowanie na podstawie statycznej struktury białka pseudotrajektorię możliwych zmian konformacyjnych. Narzędzie powinno pozwalać na podłączanie baz deskryptorów lokalnej struktury (co pozwoli na symulowanie także innych biopolimerów niż białka).

  9. [IGiK] Automatyczne wykrywanie zmian w obszarach zurbanizowanych na zdjęciach satelitarnych
    W ostatnich latach obserwowany jest dynamiczny rozwój wielu miast. Nowe inwestycje pojawiają się zarówno na przedmieściach, jak i wewnątrz obszarów już zabudowanych tzw. „zabudowa plombowa” – często budynki lokalizowane są przykładowo na terenach zalewowych bądź w korytarzach napowietrzających miasta. Dostęp do zdjęć satelitarnych pozwala na detekcję oraz monitorowanie zmian zachodzących na obszarach zurbanizowanych.
    Optymalnym rozwiązaniem byłoby stworzenie automatycznego algorytmu, który umożliwi dokładne wykrywanie zmian ze zdjęcia na zdjęcie. Utrudnieniem w pracy ze zdjęciami satelitarnymi rejestrującymi pasmo widzialne i podczerwień jest obecność chmur, dlatego algorytm powinien uwzględniać „piksele” bezchmurne. Zadaniem zespołu będzie praca z kilkoma zdjęciami satelitarnymi (format geoTiff, 10 kanałów spektralnych) i znalezienie optymalnego rozwiązania – kombinacji kanałów pozwalającej na automatyczną detekcję zmian w obszarze zurbanizowanym. Ważnym aspektem jest uniwersalność algorytmu w sensie możliwości aplikowania na innym zestawie danych satelitarnych pochodzących z tego samego sensora.

  10. [KMMF FUW] Macierze magiczne unitarne
  11. [ZB, IFD FUW] LGC (Large Glider Collider)
    Celem zadania jest stworzenie LGC (Large Glider Collider), czyli narzędzia, w którym można przeprowadzać zderzenia gliderów — samoreplikujących się obiektów pojawiających się w automatach komórkowych. W ramach zadania należy stworzyć narzędzia do symulacji automatów komórkowych i detektor gliderów. Następnie uczestnicy przeprowadzą serię zderzeń w celu zbadania produktów reakcji. Szczególnie ważne jest ustalenie, czy wśród produktów nie pojawią się nowy, nieznane wcześniej glidery. Ilustracja przedstawia przykładowe zderzenie w jednym z automatów komórkowych.