Introduction aux Big Data

Introduction aux Big Data

Indexation et Classification des données

L’indexation est une opération qui pointe sur l’emplacement des dossiers, fichiers et enregistrements. Dans cette étape, une identification de l’emplacement des ressources est réalisée
afin de faciliter l’étape de classification.La classification des données nous permet de catégoriser les données selon certaines caractéristiques et/ou formats pour faciliter la détermination des valeurs des données et l’accès à ces derniers.Les risques peuvent inclure des pertes de données sur des indexes non existants ou une allocation de ressource pour des raisons de sécurité inapproprié à cause d’une mauvaise classification des données qui finit par dévaloriser son importance

Extraction des données

Souvent, les informations recueillies ne sont pas dans un format près à l’analyse. Nous ne pouvons pas laisser les données dans les formes d’origine en les analysants. Mais, nous devons plutôt exiger un procédé d’extraction qui extrait les informations requises par les sources sous-adjacentes et les exprime sous une forme structurée adaptée pour l’analyse

Nettoyage des données

Plusieurs données peuvent nous tromper. Par exemple, plusieurs clients peuvent choisir de masquer les comportements à risques et les personnes qui accueillent ces données peuvent donner de mauvaises analyses. Les travaux existants sur le nettoyage des données supposent des contraintes bien connues sur des données valides ou des modèles d’erreur bien compris [4].

Intégration et agrégation des données

Compte tenu de l’hétérogénéité des données, il ne suffit pas de les enregistrer. Si on stocke seulement l’ensemble de données dans le référentiel, il est peu probable que quiconque ne sera jamais en mesure de trouver ou d’utiliser ces données. Avec des métadonnées adéquates la probabilité augmente mais malgré cela, ce processus reste difficile dû à des différences dans les détails et dans la structure d’enregistrement de données [4].
Pour une analyse efficace à grande échelle, tout cela doit se faire de façon complètement automatisée. Cela nécessite que les différences dans la structure de données et la sémantique s’expriment dans des formes qui sont compréhensibles aux machines. Le processus d’intégration des données nécessite un environnement de travail très fort. [4]

Traitement des requêtes

Les méthodes d’interrogation et d’exploitation des Big Data sont fondamentalement différentes des analyses traditionnelles sur des petits échantillons de données. Les Big Data sont souvent bruyants, dynamiques, hétérogènes, interdépendants et indignes de confiance. Néanmoins, même les Big Data bruyants pourrait être précieux plus que des petits échantillons de données.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport gratuit propose le téléchargement des modèles gratuits de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Introduction Générale
Chapitre I Introduction aux Big Data
Introduction
1. Origines et historique
2. Caractéristiques des Big Data
3. Traitement Cycle de vie des Big Data
4. Domaines d’application
Conclusion
Chapitre II Productions scientifiques Etat de l’art
Introduction
1. Big Data, contexte général
2. Architectures proposées
3. Stockage des données
4. Analyse des données
5. Sécurité
6. Big Data et domaine médicale
Conclusion
Chapitre III Technologies et application
Introduction
1. Les systèmes NoSQL ( Not Only SQL
1.1. Naissance des bases de données NoSQL
1.2. Idée générale sur les systèmes NoSQL
2. Le Framework Hadoop
2.1. Présentation de Hadoop
2.2. Composants Apache Hadoop
3. Langage R
3.1. Opérations sur les données
3.2. Modélisation de données dans R
4. Combinaison de Hadoop et R
4.1. RHipe
4.2. RHadoop
4.3. Hadoop streaming
Conclusion 

Rapport de fin d'études, mémoire et thèse complet en pdfTélécharger le rapport complet 

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *