La notion de « Big Data » est utilisée pour désigner un très gros volume de données structurée ou non. Les outils classiques de gestion de bases de données ne sont plus adaptés pour procéder à leur traitement et analyse. Les possibilités de collecte de données sont, en effet, devenues considérables : smartgrids, smartmeters, géolocalisation, transactions marchandes en ligne, réseaux sociaux, communications machine to machine.
Les entreprises ont rapidement cerné l’intérêt de la maîtrise des Big Data. La maîtrise de ces Big Data serait une révolution tant pour les entreprises que pour le service public :
– optimisation et fluidification des processus ;
– amélioration de la productivité ;
– meilleur prise de décision ;
– captation des tendances ;
– etc.
Il est d’ores et déjà admis que les premières qui atteindront cet objectif gagneront un avantage concurrentiel certain. Le traitement et l’analyse en temps réel des Big Data sont donc une promesse permettant de faire face à l’augmentation exponentielle du volume des données. Cependant, pour que la promesse devienne réalité, les entreprises doivent définir leur « data-strategy » et relever de nombreux défis…
Face à l’afflux de données, la donnée est au cœur de la stratégie de l’entreprise. Les défis du Big Data pour l’entreprise sont de trois ordres : technique, économique et juridique.
Défi technique. Le défi le plus important porte sur la refonte intégrale des outils classiques de gestion de bases de données. Ces outils ne permettent, en effet, plus de traiter cette masse de données. Il faut donc repenser les bases de données traditionnelles et leurs langages. Les Big Data ne sont plus intégrés à l’intérieur de la base de données traditionnelle mais proviennent de l’extérieur. La base devient donc virtuelle. Par ailleurs, les outils sont alimentés en temps réels à l’aide de flux entrants. Si l’on assiste déjà à la naissance des outils de gestion des « Big Data », tels que Cassandra, Hadoop, GoogleFS, BigTable, Hive ou HBase, la révolution technologique n’en est qu’à ses débuts.
Défi économique. L’afflux de volume très important de données structurées ou non est susceptible de générer de nouveaux modèles économiques. Les entreprises devront également prendre en compte les coûts relatifs à l’équipement, la gestion et l’analyse des données, la formation des techniciens, etc.
Défi juridique. Enfin, le dernier défi porte sur les risques juridiques relatifs au respect de la vie privée que rencontreront les entreprises lors du traitement des données personnelles, et dont certaines seront considérées comme sensibles. Si les risques juridiques identifiés ne sont pas nouveaux, ils sont, en revanche, d’autant plus élevés que les données collectées et traitées sont importantes.