MOC 20773
Analyzing Big Data with Microsoft R

da
600.00 €

3 giornate

Quali sono gli orari dei corsi?
I corsi in aula fisica e virtuale si svolgono dalle 9:00 alle 17:00. Nei corsi di durata pari a 5 gg. l’ultimo giorno (venerdì) si termina alle 13:00. L’intervallo per il pranzo è previsto dalle 13.00 alle 14.00. I corsi E-learning non sono soggetti ad oriario

COD: MOC 20773 Categorie: , ,

Descrizione

Questo corso ha come scopo quello di mettere in grado gli allievi di utilizzare Microsoft R Server per creare ed eseguire analisi su dataset voluminosi e capire come queste analisi possono essere utilizzate in ambienti Big Data, quali Hadoop e Spark, oppure in un database SQL Server.

Questo corso è propedeutico all’esame di certificazione Microsoft 70-773 Analyzing Big Data with Microsoft R.

Contenuti del corso

Microsoft R Server and R Client

  • What is Microsoft R server
  • Using Microsoft R client
  • The ScaleR functions

Exploring Big Data

  • Understanding ScaleR data sources
  • Reading data into an XDF object
  • Summarizing data in an XDF object

Visualizing Big Data

  • Visualizing In-memory data
  • Visualizing big data

Processing Big Data

  • Transforming Big Data
  • Managing datasets

Parallelizing Analysis Operations

  • Using the RxLocalParallel compute context with rxExec
  • Using the revoPemaR package

Creating and Evaluating Regression Models

  • Clustering Big Data
  • Generating regression models and making predictions

Creating and Evaluating Partitioning Models

  • Creating partitioning models based on decision trees.
  • Test partitioning models by making and comparing predictions

Processing Big Data in SQL Server and Hadoop

  • Using R in SQL Server
  • Using Hadoop Map/Reduce
  • Using Hadoop Spark

Partecipanti

DB Professional e Developer

Prerequisiti

Per partecipare con profitto a questo corso è necessario che gli allievi:

  • esperienza di lavoro con i database relazionali;
  • esperienza di programmazione con R e familiarità con i package R;
  • conoscenza dei principali metodi statistici e con le best practices nell’ambito della analisi dei dati;
  • conoscenza di base degli ambienti operativi Windows e delle loro principali funzionalità.

Obiettivi

Al termine del corso gli allievi saranno in grado di:

  • Explain how Microsoft R Server and Microsoft R Client work
  • Use R Client with R Server to explore big data held in different data stores
  • Visualize data by using graphs and plots
  • Transform and clean big data sets
  • Implement options for splitting analysis jobs into parallel tasks
  • Build and evaluate regression models generated from big data
  • Create, score, and deploy partitioning models generated from big data
  • Use R in the SQL Server and Hadoop environments
Cancella
Nominativi dei partecipanti: