Os dados de Meteorologia dos 3 institutos encontram-se já sob forma digital a partir de 1941 no Instituto de Meteorologia (IM). A estes dados juntam-se os primeiros registos do Porto (Escola Médico-Cirúrgica), no período 1861 1898, já digitalizados. No IGIDL foram digitalizados os primeiros anais (1856-1863) completos e a pressão até 1913. O método de digitalização dos dados meteorológicos é misto, sendo uma parte dos dados digitada manualmente no computador e outra automática, com recurso a técnicas de OCR (reconhecimento de caracteres). Neste caso são obtidas imagens tiff das tabelas publicadas que contém dados (Fig. 2 ) e o OCR é aplicado à imagem das tabelas. Todos os dados digitalizados são submetidos a testes de controlo de qualidade.
Fig. 2 - Imagens digitais dos anais (a) do IGIDL com dados bi-horários de temperatura em Lisboa em Maio de 1917 e (b) do Ministério das Colónias com dados diários de Moçambique em Julho de 1916.
Depois de passados a formato digital, os dados de meteorologia dão origem a séries temporais de parâmetros tais como a temperatura, pressão, precipitação, humidade relativa, insolação e nebulosidade, entre outros. Estas séries históricas (até 1940 no caso de Portugal continental e ilhas) irão juntar-se aos dados da base do Instituto de Meteorologia (após 1941). As séries longas serão submetidas a testes de homogeneidade e corrigidas de acordo com o resultado dos testes. Paralelamente estão a construir-se ficheiros de metadata de cada uma das estações analisadas.