É público e notório que a humanidade vem gerando cada vez mais dados - nos últimos anos produzimos mais dados do que ao longo de toda a nossa história - e que esses dados estão sendo cada vez mais utilizados, para o bem e para o mal.
Há alguns anos, talvez uma década, falava-se em "datawarehouses", armazéns de dados, estruturas em computador onde as organizações armazenariam seus dados.
O volume de dados aumentou, e começou-se a falar em "data lakes", lagos de dados; é possível que logo apareçam outras expressões, como "data oceans" ou qualquer coisa similar.
Para termos uma ideia melhor acerca desses volumes, em 2011 o volume de dados armazenados pela humanidade era de 1,8 zetabytes. Hoje são mais 40 zetabytes.
Um zetabyte corresponde a 1.180.591.620.717.411.303.424 (270) bytes - de forma muito simplificada, um byte, em sistemas convencionais, armazena um dígito ou dois algarismos.
Esse volume de dados corresponde a 57 vezes a quantidade de todos os grãos de areia de todas as praias da Terra.
Dito de outra forma, se esse volume de dados fosse salvo em discos blu-ray, o peso desses discos seria de mais de 40 milhões de toneladas.