Przetwarzanie Big Data z wykorzystaniem Apache Spark – szkolenie dla inżynierów wielkich danych

Fundacja Fork oferuje zamknięte szkolenie z systemu Apache Spark. Zainteresowanych prosimy o kontakt mailowy na: fundacjafork@gmail.com

Opis szkolenia:
Wielkie zbiory danych występują dziś w każdym sektorze gospodarki. Innowacyjne firmy IT wykorzystują potencjał Big Data, tworząc wielkoskalowe rozwiązania analityczne. Jest to możliwe dzięki nowym technologiom, takim jak ekosystem Apache Spark, który umożliwia przetwarzanie wielkich zbiorów danych i wydobywanie z nich cennych informacji.

Grupa docelowa:
Inżynierowie danych zainteresowani zastosowaniem ekosystemu Apache Spark w rozwiązywaniu rzeczywistych problemów biznesowych. Osoby chcące wykorzystywać wielkie dane, łącząc przy tym biblioteki uczenia maszynowego z językami SQL, Scala etc.

Program szkolenia:
Szkolenie z Apache Spark jest skierowane do osób zajmujących się analityką Big Data. Podczas szkolenia uczestnicy:

  •     poznają ekosystemy Hadoop i Spark;
  •     nauczą się pracować z Apache Spark tak w trybie interaktywnym (konsola), jak i wsadowym;
  •     dowiedzą się, jak realizować zapytania ETL przy użyciu Spark SQL;
  •     wykorzystają algorytmy uczenia maszynowego dostępne w bibliotece MLlib;
  •     na przykładzie Twittera dowiedzą się, jak pobierać dane poprzez API serwisów społecznościowych.

Wymagania:

  •     Podstawowa znajomość systemu Linux (Ubuntu)
  •     Do skorzystania ze szkolenia potrzebna jest podstawowa znajomość jednego z języków: Scala/Python
  •     Wymagany jest komputer przenośny z zainstalowanym klientem SSH

Prowadzący:

Piotr Jan Dendek – analityk danych w ICM na Uniwersytecie Warszawskim, programista z blisko pięcioletnim doświadczeniem w pracy z ekosystemem Apache Hadoop. Tworzył rozwiązania w językach Java, Apache Pig, Scala, Python wykorzystujące techniki uczenia maszynowego. Prelegent na konferencji Spark Summit Europe 2015. W Polskiej Akademii Nauk prowadził kurs „Web-Scale Data Mining and Processing” (3 edycje, 2014–2015). Współpracował z firmami Spotify i Xerox w projektach analizy danych.

Michał Oniszczuk – inżynier danych w ICM na Uniwersytecie Warszawskim, deweloper, pasjonat ruchu Software Craftsmanship. Współpracował z firmą Spotify w projekcie analizy danych. Posiada doświadczenie w stosowaniu technologii Apache Spark i Apache Hadoop. W zespole Market Intelligence na Parkiecie Handlu Surowcami w Bank of America Merrill Lynch w Londynie rozwijał systemy przetwarzające duże dane z wykorzystaniem technologii .NET. 

Termin*: www.icm.edu.pl/c/document_library/get_file

8 kwietnia 2016

Szkolenie odbywa sie w godzinach 9.00–17.00

Miejsce

Warszawa, ul. Prosta 69, II p. (wejście od ul. Towarowej)

Koszt: 1200 zł (w tym obiad).

W przypadku wpływu opłaty na konto Fundacji Fork przed 25 marca zniżka wynosi 20%.

Doktoranci i studenci – zniżka 20%.

Rabaty się nie sumują.

Opłata za szkolenie: 

konto Fundacji Fork: 13 1090 1870 0000 0001 2374 3071

w tytule wpłaty prosimy wpisać: Przetwarzanie Big Data z wykorzystaniem Apache Spark

Liczba miejsc ograniczona.

Zapisy przyjmujemy do dnia 6 kwietnia 2016 poprzez formularz zgłoszeniowy.

O uczestnictwie w szkoleniu decyduje kolejność wpływu opłat na konto.

* Szkolenie może zostać odwołane lub jego termin może ulec zmianie. W przypadku odwołania szkolenia uczestnicy otrzymają zwrot wpłaconych pieniędzy, a w przypadku zmiany terminu możliwe będzie wycofanie się z udziału w szkoleniu.