Para entender a magnitude destes números e o impacto dos mesmos no tráfego de dados global podemos utilizar alguns exemplos. Se uma foto de alta resolução ocupa cerca de 2 megabytes (o equivalente a cerca de mil e oitocentos páginas de texto), um vídeo de alta resolução com sete minutos ocupa 1 gigabyte (quase novecentas mil páginas de texto, ou ainda cerca de duzentos e cinquenta músicas armazenadas no formato MP3). No ano 2000, com 10 terabytes (ou 10.240 gigabytes) era possível armazenar o conteúdo dos 26 milhões de livros do acervo da biblioteca do Congresso dos EUA, considerada a maior do mundo.
Estima-se que a Google processa diariamente mais de 150 petabytes de dados (um petabyte equivale a praticamente 950 bilhões de páginas de texto), e que todas as palavras que qualquer ser humano pronunciou desde o início da História da Humanidade caibam em 5 exabytes - aproximadamente duzentos e quinze milhões de discos no formato Blu-Ray). Um zettabyte equivale a 250 bilhões de DVDs, e finalmente um yottabyte - o maior prefixo da atualidade - equivale a um trilhão de terabytes.
Relatórios divulgados pela Cisco em 2017, estimam que entre 2016 e 2021 o aumento no tráfego mensal de dados considerando apenas dispositivos móveis será de sete vezes, saindo de cerca de 85 exabytes anuais para quase 600 exabytes anuais - um crescimento anualizado de 47%. O tráfego de dados total deve praticamente triplicar, saindo de 1,2 zettabytes por ano em 2016 para 3,3 zettabytes por ano em 2021. Assumindo que esses valores continuarão crescendo, em breve é provável que precisemos de novos prefixos para representar a quantidade inimaginável de dados que trafegam pela rede todos os dias.

Mas isso não é tudo - devemos considerar, também, o universo de dados gerados pelo crescente número de dispositivos conectados através da Internet das Coisas, cujo crescimento o jornal O Estado de S. Paulo discutiu aqui. Com esse volume colossal de informações em estado permanente de criação e atualização, torna-se imperativo o desenvolvimento de ferramentas e tecnologias capazes de lidar com a análise e interpretação desses dados.