Elasticsearch training

Purpose

– understand elastic eco system.
– install elasticsearch.
– store documents with the correct format.
– know all queries.

Schedule

Présentation d’elasticsearch.
– Historique.
– License.
– Moteur Lucene.
– API Rest comme wrappeur de lucene.
– Clustering de Lucene.

Installation.
– Installation depuis deb et rpm.
– Fichiers de configuration.
– Chemin de stockage des fichiers.
– Nom du cluster, nom de la node.
– Parametres de noeud.

Indexation de documents.
– Ajout.
– Mise a jour.
– Supression.
– GET.

Format des données.
– Json.
– Notions de types et de mapping.
– Mise a jour des types ou re-indexation.

Recherche de données.
– Requete simle par query string en get.
– Composants d’une requête.
– Les différentes requêtes du query DSL.
– Savoir utiliser la requête adaptée.
– Combiner des requêtes.
– Les filtres.

Analyze de données pour le stockage.
– Fonctionnent de Lucene under the hood: comment les données sont effectivement stockées.
– Inverted index.
– Analyze API.
– Caracter filter.
– Tokenizer.
– Token filter.
– Shingles.
– Ngrams, edge ngrams.
– Stemming.

Recherche et pertinence des résultats.
– Le scoring dans lucene.
– TF et IDF.
– Boost.
– API explain.
– Re-scoring.
– function_score query.
– Scripting et score.

Agrégations.
– Facets.
– Filtres et agrégations.
– Métrics.
– Statistics.
– Approximate statistics.
– Multi bucket aggregations.
– Nesting aggregations.

Relations entre les documents.
– Nested document.
– Parent child.
– Dénormalisation.
– Search et aggregations sur les nested documents.

Scaling / montée en charge.
– Shard / replicas.
– Allocations de shard controllées.
– Scaling écritures.
– Scaling lectures.

Tuning des performances.
– Performance APIS.
– refresh, flush, merge/optimize.
– Different type de Caches.
– Query warmers.

Administration du cluster.
– Changer les settings par défault.
– Eviter les split brains.
– Monitoring.
– Plugins de monitoring.
– Rolling restart.
– Backup restore.
– Securité.
– Securité avec Shields.

Autres fonctionnalités.
– Suggesters pour l’auto complétion.
– Highlighting.
– Donnees géo localisées.

Duration

2  days up to 4 days.

Public

CTO, COO, technical project manager, system admin, developer.

Pedagogy

50 % theory, 50% practice.

Instructor

Mathieu ELIE is your instructor. Working with elasticsearch since 2011, he already performed dozens of training sessions on elasticsearch.