GE Flight Quest - Polak wśród najlepszych
Polak Paweł Jankiewicz wśród najlepszych w pierwszym etapie konkursu GE Flight Quest polegającym na opracowaniu modelu opóźnień samolotów, który miałby poprawić istniejące sposoby przewidywania dużych opóźnień. Zadaniem było oszacowanie, kiedy losowo wybrany samolot doleci do lotniska i jak długo będzie w powietrzu przed wylądowaniem.
Pierwszy etap konkursu - ten właśnie zakończony - skupiał się na poprawieniu estymacji czasu przylotu. Drugi etap, który rozpocznie się pod koniec czerwca będzie polegał na wyznaczeniu optymalnej trasy przelotu bazując na wiedzy zdobytej w pierwszym etapie. Finalnie celem GE jest minimalizowanie kosztów dzięki zmniejszeniu zużycia paliwa. Pilot, który dostanie informację, że jego lot będzie opóźniony o 30 minut może skorygować prędkość tak, aby nie spalać niepotrzebnie paliwa krążąc w pobliżu lotniska.
Paweł Jankiewicz zaznacza: „W konkursie duże opóźnienia np. powyżej 30 minut były dużo ważniejsze niż 5 minutowe i to zmniejszenie liczby dużych opóźnień było głównym celem”.
Film o podniebnych algorytmach dostępny poniżej.
Relacja Pawła Jankiewicza - zdobywcy drugiego miejsca w GE Flight Quest.
"Małpa naciskająca na chybił trafił klawisze maszyny do pisania przez nieskończenie długi czas z pewnością stworzy dowolny tekst, na przykład dzieła zebrane Williama Shakespeare'a."* Teraz wyobraźmy sobie kilkuset analityków danych, którzy przez 4 miesiące naciskają klawisze, ale nie na chybił trafił, a ich celem jest pokonanie branży w przewidywaniu opóźnień lotów. Cztery miesiące temu, GE wspólnie z Kaggle zorganizowało konkurs o nazwie Flight - jeden z bardziej ekscytujących konkursów w dziedzinie data mining jaki miał miejsce w ostatnim czasie. Konkurs był także moją prywatną przygodą.
Bez względu na naturę postawionego zadania, można być pewnym, że zbiorowa inteligencja najlepszych analityków danych na świecie wyznaczy nowe standardy i wzorce. Dowodzą tego nie tylko konkursy GE Flight Quests. Kolektyw znalazł lepsze sposoby na stworzenie rankingów szachowych, rozpoznanie złych kredytów czy nawet zlokalizowanie wieloryba po dźwięku sonaru. Oznacza to, że wiele problemów może zostać rozwiązanych szybko i efektywnie. I można wierzyć lub nie, ale można się przy tym dobrze bawić. Praca na rzeczywistych danych jest wszystkim, czego potrzebujemy.
Mieliśmy 3 miesiące na stanie się pilotami, kontrolerami lotów i personelem naziemnym w jednym. Cel był jasny - chcieliśmy wygrać. Ze swej strony chciałem rzucić swoją dotychczasową pracę i zastać pełnoprawnym analitykiem danych. Założyłem, że uplasowanie się w pierwszej trójce powinno do tego wystarczyć. Ale najpierw należało pokonać 179 zespołów...
Na początku przesiewaliśmy tabele jedna po drugiej w nadziei, że natrafimy na jakieś przyczyny, które decydowałyby o opóźnieniach. Ilość danych udostępniona przez organizatorów była ogromna. Na etapie treningowym, dla każdego lotu mieliśmy do dyspozycji informacje dotyczące warunków pogodowych (prędkość wiatru, temperatura), opóźnień powstałych na lotnisku, pozycji samolotu podczas całego lotu, i wiele innych. "BIG data" - jak nazywają je niektórzy - oznaczały dla nas równie duże kompromisy i intuicyjne przeskoki. Konkurencja (w liczbie wskazanej powyżej) nie spała. Pięcie się w klasyfikacji konkursu o tak wysokiej stawce przypominało płynięcie pod prąd rzeki. Ostatecznie mój zespół zajął 2. Miejsce, 4 sekundy za liderami. Jednak na koniec liczy się fakt, że zwycięskie algorytmy poprawiły istniejące rozwiązania o 40%. Nie można też zapominać o pokaźnych nagrodach - pierwszych pięć zespołów zabrało do domu $250.000!
Konkurs był ogromnym sukcesem, ale to dopiero pierwszy krok. Planowany jest drugi etap, w którym zwycięskie rozwiązania zostaną udoskonalone, skutkując - miejmy nadzieję powstaniem jeszcze lepszych. Liczę na to, że zwycięskie algorytmy zostaną niebawem wdrożone i przełożą się na wyższy komfort lotu, mniejsze zużycie paliwa i wiele godzin zaoszczędzonego czasu.
*Twierdzenie o nieskończonej liczbie małp.
Więcej szczegółów dotyczących projektu znaleźć można tutaj.
Komentarze