Efficacité énergétique des phases de conception et d’exploitation des entrepôts de données - Laboratoire d'Informatique et d'Automatique pour les Systèmes Accéder directement au contenu
Thèse Année : 2022

Energy Efficiency of the Design and Exploitation Phases of Data Warehouses

Efficacité énergétique des phases de conception et d’exploitation des entrepôts de données

Résumé

Nowadays, everyone agrees that the world's most valuable resource is no longer oil but data. But, like oil, data is a source of pollution, mainly caused by the processing of large amounts of data by servers and data centers. This has prompted many organizations and countries to devote considerable effort and investment to reduce energy consumption. Providers of data storage and processing solutions are therefore at the heart of the green IT debate. These solutions must simultaneously satisfy two conflicting non-functional requirements (nFR): (i) query performance and (ii) energy reduction. These nFRs are strongly related to query processing. Unlike performance, which has been widely studied by academia and industry, energy reduction, does not receive the same attention. Current work dealing with energy efficiency (EE) of databases is mainly focused on logical optimizations and cost models definitions. However, no one can deny that satisfying the first nFR necessarily requires physical optimizations through optimization structures such as indexes and that the database schema has a direct impact on its optimization. In this thesis, we aim to reduce the energy consumption of databases from a software point of view by integrating energy in the different stages of its life cycle. To promote and defend our vision of a green world, we first introduce a multi-objective approach to select a type of indexes called the bitmap join index (BJI). In this approach we propose a new formalization of the BJIs selection problem by integrating the energy dimension. Then, we tried to capture the energy earlier in the life cycle of the database and study the impact of the variability of the logical schema on the energy consumption of databases. In each of the contributions of this thesis, algorithms are developed in order to implement the proposed approaches and intensive experiments are conducted on SSB benchmark using hardware devices to measure energy consumption.
Aujourd'hui, tout le monde s'est mis d'accord pour dire que la ressource la plus précieuse du monde n'est plus le pétrole mais les données. Mais, comme le pétrole, les données sont une source de pollution, principalement causée par le traitement de grandes quantités de données par les serveurs et les centres de données. Ce qui a incité de nombreuses organisations et pays à consacrer des efforts et des investissements considérables pour réduire la consommation d'énergie. Les fournisseurs de solutions de stockage et de traitement des données sont donc au cœur du débat sur l'informatique verte. Ces solutions doivent satisfaire en même temps deux besoins non-fonctionnels (BnF) conflictuels : (i) la performance des requêtes et (ii) la réduction de la consommation d'énergie. Ces BnFs sont fortement liées aux traitement des requêtes. Contrairement à la performance, qui a été largement étudiée par le monde universitaire et l'industrie, la réduction de l'énergie, ne reçoit pas la même attention. Les travaux actuels traitant l'efficacité énergétique (EE) des bases de données sont principalement axés sur les optimisations logiques et la définitions des modèles de coût. Cependant, personne ne peut nier que la satisfaction du premier BnF passe nécessairement par des optimisations physiques grâce aux structures d’optimisation telles que les indexes et que le schéma de la base de données à un impact direct sur son optimisation. Dans cette thèse, nous visons à réduire la consommation énergétique des bases de données d'un point de vue logiciel en intégrant l'énergie dans des différentes étapes de son cycle de vie. Pour promouvoir et défendre notre vision d'un monde vert, nous introduisons au premier lieu, une approche multi-objectif de sélection d'un type d'index appelé l'index de jointure binaire (IJB). Dans cette approche nous proposons une nouvelle formalisation du problème de sélection des IJBs en intégrant la dimension énergétique.Ensuite, nous avons essayé de capter l'énergie plutôt dans le cycle de vie de la BD et étudier l'impact de la variabilité du schéma logique sur la consommation énergétique des bases de données. Dans chacune des contributions de cette thèse, des algorithmes sont développés afin de d'implémenter les approches proposées et des expérimentations intensives sont menées sur les données du benchmark SSB en utilisant des dispositifs matériels permettant de mesurer l'énergie consommées.
Fichier principal
Vignette du fichier
2022ESMA0023_ghabri.pdf (7.21 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03976958 , version 1 (07-02-2023)

Identifiants

  • HAL Id : tel-03976958 , version 1

Citer

Issam Ghabri. Efficacité énergétique des phases de conception et d’exploitation des entrepôts de données. Autre [cs.OH]. ISAE-ENSMA Ecole Nationale Supérieure de Mécanique et d'Aérotechique - Poitiers, 2022. Français. ⟨NNT : 2022ESMA0023⟩. ⟨tel-03976958⟩
110 Consultations
51 Téléchargements

Partager

Gmail Facebook X LinkedIn More