/FORMAZIONE
STRATEGY
Affianchiamo le aziende nell’individuare le best practice per lo sviluppo di una “big data strategy” e le migliori tecnologie per implementare un’efficace strategia di analisi. Per comprendere come avviare questo processo, spesso ricorriamo a sessioni di hacking per i nostri clienti, rivolte a personale non-tecnico: seminari personalizzati per individuare i casi d’uso più significativi e le indicazioni più interessanti, per analizzare e mappare li panorama aziendale dei dati, supportare la revisione del modello di business e calcolare il ROI di un possibile progetto.
DATA SCIENCE
MACHINE LEARNING
Il Machine Learning è la disciplina che “insegna” ai computer l’abilità di apprendere dai dati e risolvere problemi, senza essere specificamente programmati per farlo. Negli ultimi 10 anni questa tecnica ha consentito a molte aziende di vincere sfide in passato considerate impossibili, sia per grandi imprese, che PMI o start-up innovative.
Partecipando al corso sarà possibile scoprire come sfruttare le potenzialità del Machine Learning, sia in teoria che in pratica, anche in ambienti distribuiti, attraverso esercitazioni e reali casi d’uso.
introduction ITA
- Scope and motivations
- Terminology and workflow
- Typical pipelines
- Approaches and algorithms
- Algorithms in-depth
- Use cases and demo
Advanced
- Features Engineering
- Advanced pipelines
- Specialized Algorithms
- Model selection and evaluation
- Recommender systems
- Use cases and demo
Large Scale
- Spark MLlib and Big Data
- Deep Learning

lorem ipsum dolor sit amet
Python 4 Data Science
Python è un linguaggio con una semplice sintassi e un potente insieme di librerie. È un linguaggio interpretato, con un ricco ambiente di programmazione, che include un robusto debugger e un profilatore. Sebbene sia facile da imparare per i principianti, è ampiamente usato in molte aree scientifiche per l’esplorazione dei dati. Questo corso è un’introduzione al linguaggio Python dedicato a sviluppatori con precedenti esperienze di programmazione con altri linguaggi. Affronteremo i tipi di dati, il flusso di controllo, la programmazione orientata agli oggetti, e introdurremo l’insieme delle librerie più utilizzate nel campo della Data Visulization e Data Science.
Artificial Intelligence
Il termine “Intelligenza Artificiale” è usato per descrivere macchine che imitano funzioni “cognitive” che gli esseri umani associano con altre menti umane, come “apprendimento” e “problem solving”. Il corso introduce le tecniche di base per l’implementazione di queste caratteristiche: Machine Learning, Deep Learning attraverso l’utilizzo di reti neurali e Reinforcement Learning.
TECHNOLOGY
SPARK
Apache Spark gioca un ruolo importante nelle moderne piattaforme di grandi dati grazie alle sue prestazioni, flessibilità, modularità e integrazioni con altre tecnologie. La sua facilità d’uso e l’astrazione dal calcolo distribuito lo rende accessibile ad un vasto pubblico di sviluppatori. Tuttavia, questa astrazione porta facilmente a basse prestazioni e ad un uso molto scadente delle risorse del cluster, se usato senza comprenderne alcuni concetti fondamentali.
Questo corso ha lo scopo di spiegare come funziona Spark, come utilizzarlo correttamente essendo consapevoli di ciò che accade, per sfruttare le sue caratteristiche raggiungendo alte prestazioni e scalabilità.
Giorno 1
- BigData overview
- Spark Story & Community
- Spark vs Hadoop
- Spark Integrations
- Spark Build
- Spark Deployment
- How it works
- API overview
- First Job (LAB)
- RddAPI (LAB)
Giorno 2
- RDD vs DataFrame vs DataSet
- DataFrame API (LAB)
- Final project (LAB)
- Tips & Tricks
- Spark SQL
- SparkSQL vs Hive vs Impala
- SparkSQL API
- SparkSQL Job ( API )
- Spark Thrift Server + BI connection

Giorno 1
- Spark Streaming
- Spark Streaming vs Storm vs Flink
- Spark Streaming integrations
- First stream Job (LAB)
- Lamda Architecture
- Advanced Streaming (LAB)
- Spark for Machine learning
- ML vs MLLib
- Algorithms
Giorno 2
- Clustering: K-Means (LAB)
- Recommendation: ALS (LAB)
- Model Server with Lambda Architecture
- Model selection and evaluation
- Tips & Tricks
- Datascience & Production
- Spark Notebook

HADOOP
Apache Hadoop è un framework open-source per elaborazioni affidabili, scalabili e distribuite. Ha alcuni moduli principali, come HDFS o YARN, oltre che parecchi progetti collegati, quali: motori di calcolo, sistemi di archiviazione dati, servizi di coordinamento e molto altro ancora!In questo scenario complesso, che continua a crescere nel tempo, è difficile trovare gli strumenti giusti per i vari casi d’uso.
Questo corso ha lo scopo di mostrare i principali attori di questo ecosistema, cosa fanno, come funzionano e come potrebbero essere utilizzati insieme per costruire piattaforme complesse al servizio delle diverse esigenze di business.
Big Data Platforms ITA
- Overview
- NoSQL benchmarking
Hadoop + Cloudera components
- Hadoop vs RDBMS
- Hadoop in Enterprise
Data Stores
- HDFS Advanced
- HBase Design & DataModel
- Solr
Data Ingestion
- Kafka
- Sqoop
- Flume
Data Analysis
- Impala
- Hive
- Mapreduce Concepts & Development
- Mapreduce Input&Output
Architecture
- Security Authentication
- Security Authorisation
- Hadoop Processes

Design & Setup ITA
- Hardware considerations
- Software installation
- Launch
Configuration
- Core config
- Sanity tests
- Machanics
- Resources management
Monitoring
- Charts & Dashboards
- Custom triggers, custom alerts
- Integrations and REST API
Test & Benchmarks
- Functionality Tests
- Performance
Operations
- Cloudera Manager
- HDFS operations
- Host maintenance
- Disaster recovery
- Troubleshooting

CASSANDRA
Cassandra è uno dei più diffusi database NoSQL per IoT, dati non strutturati e grandi carichi di lavoro OLTP.
NoSQL è il compromesso più classico dell’informatica: prestazioni contro flessibilità. Per il successo di un progetto, è fondamentale sfruttarlo nel modo corretto, sia dal punto di vista dello sviluppo che dal punto di vista operativo.
Attraverso questo corso potrete comprendere le principali caratteristiche delle soluzioni NoSQL disponibili, approfondendo poi con l’architettura di Cassandra, scoprendo i suoi punti di forza, le insidie e le best practice per fare le migliori scelte in maniera autonoma e consapevole.
giorno 1
- BigData and NoSQL overview
- Installation and configuration (LAB)
- Tools: nodetool, cqlsh, stress (LAB)
- Replication and Consistency
- Gossip
- Data Model
giorno 2
- CQL (LAB)
- Write and Read Path (LAB)
- Compaction and Tombstoning
- Hardware best practices

parte 1
- Environment
- Adding nodes (LAB)
- Remove, Decommission and Replace nodes (LAB)
- Bootstrap and Cleanup
- Hinted Handoff (LAB)
- Repair (LAB)
parte 2
- Backup and Recovery
- Security
- DR and MultiDatacenter
- JVM tuning
- Disk tuning

parte 1
- Logical model
- Conceptual model
- Physical model
- Data Types
- How to validate model
parte 2
- Transactions
- Client Side Joins
- Best practices
- Workshop (LAB)

parte 1
- Datastax overview
- Solr Overview
- Search fundamentals
- Solr Queries (LAB)
- Inverted Index and Document Scoring Datastax integration
- CQL Extensions (LAB) Cassandra Spark Connector Read from Cassandra
parte2
- Write into Cassandra
- Group by, Join and Partitioning Dataframe
- Lambda architecture

Lightbend Certified Trainers
Corsi Lightbend.
- I contenuti saranno disponibili a breve.
BLOCKCHAIN
I principali concetti della tecnologia Blockchain.
La tecnologia Blockchain sfrutta varie tipologie di strutture decentralizzate al fine di risolvere il problema di centralizzare i dati e le conoscenze. Non sono una novità ma l’utilizzo delle stesse per progetti socialmente rivoluzionari, candida la Blockchain ad essere fautrice della quarta rivoluzione industriale. Grazie a questo corso è possibile avere una overview d’insieme e sarà possibile avere coscienza di come la tecnologia possa aiutare a fare business, per risolvere problematiche pratiche o introdurre nuovi prodotti sul mercato.
introduzione
- Algoritmi di consenso (PoW, PoS, DPos, PoB, PoE.…)
- Wallet e sicurezza (byzantine fault, dos, 51%, sybil, double spend etc)
- Bitcoin (storia e attualità)
- Bitcoin - lightning network (storia e attualità)
- Ethereum e smart contract (storia e strumenti di sviluppo)
- Privacy coin (monero / Zcash)
- Altre DLT (IOTA e Hyperledger)
- Panoramica su progetti più famosi e interessanti
- Exchange - trading

introduction
- Privacy coin (monero / Zcash)
- Other DLT (IOTA and Hyperledger)
- Exchange - trading
- Managing a full node (bitcoin / ethereum / iota)
- Smart contracts (LAB)
- IOTA (LAB)

CLOUD & DEV-OPS
Il dettaglio dei contenuti sarà disponibile prossimamente.
- Docker & Kubernes
- Google GCP
- Amazon AWS
- Microsoft Azure
LINGUAGGI
SCALA
Scala è un linguaggio di programmazione fortemente tipizzato che supporta la programmazione funzionale. Si integra perfettamente con Java. Scala è il linguaggio di implementazione di molti importanti framework, tra cui Apache Spark, Kafka e Akka. Fornisce l’infrastruttura di base per siti come Twitter, Tumblr e anche Coursera. In questo corso scoprirete gli elementi dello stile di programmazione funzionale e imparerete ad applicarli nelle vostre attività di programmazione quotidiana. Imparerete inoltre ad utilizzare gli strumenti e i framework più diffusi tra gli sviluppatori a livello aziendale.
PYTHON
Python è un linguaggio con una semplice sintassi che dispone di un vasto insieme di librerie. È un linguaggio interpretato, caratterizzato da un ricco ambiente di programmazione, che include un robusto debugger e un profilatore. E’ un linguaggio semplice da imparare per i principianti ed è ampiamente usato in molte aree, a partire dall’amministrazione del sistema e dagli sviluppatori fino allo sviluppo di applicazioni web e alla data science. Questo corso vi insegnerà i fondamenti e l’uso di Python, con un focus sullo sviluppo di best practice ed nell’esplorazione delle parti estensibili e uniche di questo linguaggio.