/FORMAZIONE

STRATEGY

Affianchiamo le aziende nell’individuare le best practice per lo sviluppo di una “big data strategy” e le migliori tecnologie per implementare un’efficace strategia di analisi. Per comprendere come avviare questo processo, spesso ricorriamo a sessioni di hacking per i nostri clienti, rivolte a personale non-tecnico: seminari personalizzati per individuare i casi d’uso più significativi e le indicazioni più interessanti, per analizzare e mappare li panorama aziendale dei dati, supportare la revisione del modello di business e calcolare il ROI di un possibile progetto.

DATA SCIENCE

MACHINE LEARNING

Il Machine Learning è la disciplina che “insegna” ai computer l’abilità di apprendere dai dati e risolvere problemi, senza essere specificamente programmati per farlo.  Negli ultimi 10 anni questa tecnica ha consentito a molte aziende di vincere sfide in passato considerate impossibili, sia per grandi imprese, che PMI o start-up innovative.
Partecipando al corso sarà possibile scoprire come sfruttare le potenzialità del Machine Learning, sia in teoria che in pratica, anche in ambienti distribuiti, attraverso esercitazioni e reali casi d’uso.

Machine Learning (3 days) ITA

introduction ITA

  • Scope and motivations
  • Terminology and workflow
  • Typical pipelines
  • Approaches and algorithms
  • Algorithms in-depth
  • Use cases and demo

Advanced

  • Features Engineering
  • Advanced pipelines
  • Specialized Algorithms
  • Model selection and evaluation
  • Recommender systems
  • Use cases and demo

Large Scale

  • Spark MLlib and Big Data
  • Deep Learning

lorem ipsum dolor sit amet

Python 4 Data Science

Python è un linguaggio con una semplice sintassi e un potente insieme di librerie. È un linguaggio interpretato, con un ricco ambiente di programmazione, che include un robusto debugger e un profilatore. Sebbene sia facile da imparare per i principianti, è ampiamente usato in molte aree scientifiche per l’esplorazione dei dati. Questo corso è un’introduzione al linguaggio Python dedicato a sviluppatori con precedenti esperienze di programmazione con altri linguaggi. Affronteremo i tipi di dati, il flusso di controllo, la programmazione orientata agli oggetti, e introdurremo l’insieme delle librerie più utilizzate nel campo della Data Visulization e Data Science.

Artificial Intelligence

Il termine “Intelligenza Artificiale” è usato per descrivere macchine che imitano funzioni “cognitive” che gli esseri umani associano con altre menti umane, come “apprendimento” e “problem solving”. Il corso introduce le tecniche di base per l’implementazione di queste caratteristiche: Machine Learning, Deep Learning attraverso l’utilizzo di reti neurali e Reinforcement Learning.

TECHNOLOGY

SPARK

Apache Spark gioca un ruolo importante nelle moderne piattaforme di grandi dati grazie alle sue prestazioni, flessibilità, modularità e integrazioni con altre tecnologie. La sua facilità d’uso e l’astrazione dal calcolo distribuito lo rende accessibile ad un vasto pubblico di sviluppatori. Tuttavia, questa astrazione porta facilmente a basse prestazioni e ad un uso molto scadente delle risorse del cluster, se usato senza comprenderne alcuni concetti fondamentali.

Questo corso ha lo scopo di spiegare come funziona Spark, come utilizzarlo correttamente essendo consapevoli di ciò che accade, per sfruttare le sue caratteristiche raggiungendo alte prestazioni e scalabilità.

Spark Core + Spark SQL (2 giorni)

Giorno 1

  • BigData overview
  • Spark Story & Community
  • Spark vs Hadoop
  • Spark Integrations
  • Spark Build
  • Spark Deployment
  • How it works
  • API overview
  • First Job (LAB)
  • RddAPI (LAB)

Giorno 2

  • RDD vs DataFrame vs DataSet
  • DataFrame API (LAB)
  • Final project (LAB)
  • Tips & Tricks
  • Spark SQL
  • SparkSQL vs Hive vs Impala
  • SparkSQL API
  • SparkSQL Job ( API )
  • Spark Thrift Server + BI connection
Spark Streaming + Spark ML (2 giorni)

Giorno 1

  • Spark Streaming
  • Spark Streaming vs Storm vs Flink
  • Spark Streaming integrations
  • First stream Job (LAB)
  • Lamda Architecture
  • Advanced Streaming (LAB)
  • Spark for Machine learning
  • ML vs MLLib
  • Algorithms

Giorno 2

  • Clustering: K-Means (LAB)
  • Recommendation: ALS (LAB)
  • Model Server with Lambda Architecture
  • Model selection and evaluation
  • Tips & Tricks
  • Datascience & Production
  • Spark Notebook

HADOOP

Apache Hadoop è un framework open-source per elaborazioni affidabili, scalabili e distribuite. Ha alcuni moduli principali, come HDFS o YARN, oltre che parecchi progetti collegati, quali: motori di calcolo, sistemi di archiviazione dati, servizi di coordinamento e molto altro ancora!In questo scenario complesso, che continua a crescere nel tempo, è difficile trovare gli strumenti giusti per i vari casi d’uso.

Questo corso ha lo scopo di mostrare i principali attori di questo ecosistema, cosa fanno, come funzionano e come potrebbero essere utilizzati insieme per costruire piattaforme complesse al servizio delle diverse esigenze di business.

Introduzione a Hadoop (2 giorni)

Big Data Platforms ITA

  • Overview
  • NoSQL benchmarking

Hadoop + Cloudera components

  • Hadoop vs RDBMS
  • Hadoop in Enterprise

Data Stores

  • HDFS Advanced
  • HBase Design & DataModel
  • Solr

Data Ingestion

  • Kafka
  • Sqoop
  • Flume

Data Analysis

  • Impala
  • Hive
  • Mapreduce Concepts & Development
  • Mapreduce Input&Output

Architecture

  • Security Authentication
  • Security Authorisation
  • Hadoop Processes
Administration - Approfondimento (1 giorno)

Design & Setup ITA

  • Hardware considerations
  • Software installation
  • Launch

Configuration

  • Core config
  • Sanity tests
  • Machanics
  • Resources management

Monitoring

  • Charts & Dashboards
  • Custom triggers, custom alerts
  • Integrations and REST API

Test & Benchmarks

  • Functionality Tests
  • Performance

Operations

  • Cloudera Manager
  • HDFS operations
  • Host maintenance
  • Disaster recovery
  • Troubleshooting

CASSANDRA

Cassandra è uno dei più diffusi database NoSQL per IoT, dati non strutturati e grandi carichi di lavoro OLTP.
NoSQL è il compromesso più classico dell’informatica: prestazioni contro flessibilità. Per il successo di un progetto, è fondamentale sfruttarlo nel modo corretto, sia dal punto di vista dello sviluppo che dal punto di vista operativo.

Attraverso questo corso potrete comprendere le principali caratteristiche delle soluzioni NoSQL disponibili, approfondendo poi con l’architettura di Cassandra, scoprendo i suoi punti di forza, le insidie e le best practice per fare le migliori scelte in maniera autonoma e consapevole.

Cassandra Core (2 giorni)

giorno 1

  • BigData and NoSQL overview
  • Installation and configuration (LAB)
  • Tools: nodetool, cqlsh, stress (LAB)
  • Replication and Consistency
  • Gossip
  • Data Model


giorno 2

  • CQL (LAB)
  • Write and Read Path (LAB)
  • Compaction and Tombstoning
  • Hardware best practices
Operations (1 giorno)

parte 1

  • Environment
  • Adding nodes (LAB)
  • Remove, Decommission and Replace nodes (LAB)
  • Bootstrap and Cleanup
  • Hinted Handoff (LAB)
  • Repair (LAB)

parte 2

  • Backup and Recovery
  • Security
  • DR and MultiDatacenter
  • JVM tuning
  • Disk tuning
Data Model (1 giorno)

parte 1

  • Logical model
  • Conceptual model
  • Physical model
  • Data Types
  • How to validate model

parte 2

  • Transactions
  • Client Side Joins
  • Best practices
  • Workshop (LAB)
Datastax platform and integrations (1 giorno)

parte 1

  • Datastax overview
  • Solr Overview
  • Search fundamentals
  • Solr Queries (LAB)
  • Inverted Index and Document Scoring Datastax integration
  • CQL Extensions (LAB) Cassandra Spark Connector Read from Cassandra

parte2

  • Write into Cassandra
  • Group by, Join and Partitioning Dataframe
  • Lambda architecture

Lightbend Certified Trainers

Corsi Lightbend.

  • I contenuti saranno disponibili a breve.

BLOCKCHAIN

I principali concetti della tecnologia Blockchain.

La tecnologia Blockchain sfrutta varie tipologie di strutture decentralizzate al fine di risolvere il problema di centralizzare i dati e le conoscenze. Non sono una novità ma l’utilizzo delle stesse per progetti socialmente rivoluzionari, candida la Blockchain ad essere fautrice della quarta rivoluzione industriale. Grazie a questo corso è possibile avere una overview d’insieme e sarà possibile avere coscienza di come la tecnologia possa aiutare a fare business, per risolvere problematiche pratiche o introdurre nuovi prodotti sul mercato. 

Blockchain - Basic

introduzione

  • Algoritmi di consenso (PoW, PoS, DPos, PoB, PoE.…)
  • Wallet e sicurezza (byzantine fault, dos, 51%, sybil, double spend etc)
  • Bitcoin (storia e attualità)
  • Bitcoin - lightning network (storia e attualità)
  • Ethereum e smart contract (storia e strumenti di sviluppo)
  • Privacy coin (monero / Zcash)
  • Altre DLT (IOTA e Hyperledger)
  • Panoramica su progetti più famosi e interessanti
  • Exchange - trading
Blockchain - Advanced

introduction

  • Privacy coin (monero / Zcash)
  • Other DLT (IOTA and Hyperledger)
  • Exchange - trading
  • Managing a full node (bitcoin / ethereum / iota)
  • Smart contracts (LAB)
  • IOTA (LAB)

CLOUD & DEVELOPS

Il dettaglio dei contenuti sarà disponibile prossimamente.

  • Docker & Kubernes
  • Google GCP
  • Amazon AWS
  • Microsoft Azure

LINGUAGGI

SCALA

Scala è un linguaggio di programmazione fortemente tipizzato che supporta la programmazione funzionale. Si integra perfettamente con Java. Scala è il linguaggio di implementazione di molti importanti framework, tra cui Apache Spark, Kafka e Akka. Fornisce l’infrastruttura di base per siti come Twitter, Tumblr e anche Coursera. In questo corso scoprirete gli elementi dello stile di programmazione funzionale e imparerete ad applicarli nelle vostre attività di programmazione quotidiana. Imparerete inoltre ad utilizzare gli strumenti e i framework più diffusi tra gli sviluppatori a livello aziendale.

PYTHON

Python è un linguaggio con una semplice sintassi che dispone di un vasto insieme di librerie. È un linguaggio interpretato, caratterizzato da un ricco ambiente di programmazione, che include un robusto debugger e un profilatore. E’ un linguaggio semplice da imparare per i principianti ed è ampiamente usato in molte aree, a partire dall’amministrazione del sistema e dagli sviluppatori fino allo sviluppo di applicazioni web e alla data science. Questo corso vi insegnerà i fondamenti e l’uso di Python, con un focus sullo sviluppo di best practice ed nell’esplorazione delle parti estensibili e uniche di questo linguaggio.

E-Learning

Migliora le tue conoscenze quando vuoi e dove vuoi.