terça-feira, maio 17, 2005

A Preservação de Objectos Digitais

A grande mutação tecnológica ocorrida nestas últimas décadas deixou a descoberto um grande problema que só agora é que está ser levado a sério. O que está em causa é o acesso a médio-longo prazo aos objectos digitais que são produzidos constantemente pelo ser humano. Este problema ocorre, porque o Homem não consegue preservar da mesma forma um livro na estante ou este trabalho num computador. Se o livro estiver bem acondicionado e o espaço cumprir as regras básicas de preservação, é provável que daqui a 10 anos, o mesmo livro ainda esteja intacto e em bom estado para ser consultado. Ao invés disso, este trabalho ao ser guardado num ambiente digital por 10 anos sem qualquer estratégia de preservação a longo prazo, torna o seu acesso muito improvável, pois o mais certo é que tanto o formato do objecto como o sistema em que está inserido já esteja obsoleto e inacessível, perdendo-se assim o acesso ao conteúdo do mesmo.

Que estratégia implementar? Qual é a melhor opção a ter em conta dentro das várias estratégias de preservação a longo prazo?

Supondo que se está a desenvolver uma estratégia para um repositório digital, o seu desempenho só terá sucesso se forem seguidas boas práticas, assim como o uso de metadados de preservação ao longo de todas as fases do ciclo de vida do recurso digital. Se por ventura, optar pela estratégia da migração, o repositório não tem como saber o que deixa em legado, tornando-se assim impossível de prognosticar quantas vezes vai ser necessário migrar, dado que os standards podem ter uma vida curta no ambiente digital. Este processo requer o uso de boas práticas no decorrer da criação dos objectos digitais a preservar, assim como uma grande atenção às técnicas de reparação usadas e aos metadados que documentam todo este processo, com o objectivo de minimizar o nível de corrupção dos objectos digitais. Esta estratégia de preservação pode ter como pontos críticos a quantidade de trabalho, o alto custo, a quantidade de tempo que pode levar a realizar o processo, a falta de progressão e a corrupção do look-and-feel. Ao optar-se pela emulação vamos entrar numa estratégia que tem suscitado alguma polémica e tem sido motivo de discussão científica, envolvendo vários peritos da área. Na opinião de alguns, os emuladores ao ficarem obsoletos tornam-se tão problemáticos como manter os objectos digitais em formatos obsoletos. Mesmo que a integridade do objecto digital seja corrompida durante o processo de preservação, este facto pode não ser relevante para as necessidades dos utilizadores, pois o que tem maior importância é o acesso aos mesmos.

A melhor estratégia de preservação está dependente de vários factores, como o custo, a investigação aplicada ao caso concreto onde se deseja aplicar a estratégia de preservação, o estabelecimento de consórcios entre entidades com objectivos similares, a coragem de arriscar na estratégia que melhor satisfaz e mais garantias dá ao caso concreto, etc. Como tal, cada instituição deve atender à natureza dos recursos e às necessidades das comunidades de utilizadores do nosso tempo para poder projectá-las para as comunidades vindouras.

Cada plano de preservação a longo prazo implica custo e tempo de execução diferentes. A preservação digital requer recursos disponíveis a todo o momento, desde que é criado o objecto digital. A preservação digital ao contrário da preservação dos suportes tradicionais requer investimentos mais frequentes para superar a rápida obsolescência produzida pela constante mutação tecnológica. Os produtores de objectos digitais precisam investir para criar documentação e metadados, originando novos recursos para permitir o acesso aos objectos. As entidades que investem na preservação podem obter algum retorno financeiro ao levar em conta os direitos de uso e reutilização dos objectos digitais. Outra aposta importante que requer custos elevados passa pela contratação de profissionais qualificados, assim como a disponibilização de formação constante. Uma estratégia de preservação a longo prazo não pode ser bem sucedida se não tiver em conta os custos e os recursos que são necessários para levar a cabo esta árdua tarefa. Assim sendo, as relações complexas entre as diversas práticas envolvidas no ciclo de vida dos recursos digitais sugerem, acima de tudo, um conjunto de políticas integradas de forma a desenvolver uma posição que, e de uma forma clara, congregue os esforços e os custos de criação, preservação e uso desses mesmos objectos.

A preservação digital não envolve somente o objecto digital em si, mas também o seu significado. É necessário, portanto, que as técnicas de preservação sejam capazes de compreender e recriar a forma original ou a função do objecto de forma a que seja assegurada a sua autenticidade e acessibilidade. Como tal, não se pode salvar os objectos digitais como documentos físicos. Além do mais, as estratégias de preservação devem de ter uma amplitude tal, que incorporam outros aspectos como sendo o custo-benefício, legalidade, direitos de autor, gestão e requisitos de acesso.

O principal problema da preservação é o conteúdo, ou seja, a substância intelectual que está contida nos objectos digitais. Mas no mundo digital a noção de conteúdo é complexa e estratificada. Na actualidade, a maioria dos utilizadores não se importam muito se um objecto não corresponde totalmente ao aspecto fisico que tinha inicialmente, desde que possa aceder ao seu conteúdo informacional. Mas o problema levanta-se constantemente, pois há vários formatos de objectos com características muito específicas como os vídeos, que torna-se impossível aceder à informação se o objecto estiver corrompido. Uma das soluções para esta situção passa pelas organizações responsáveis pelos projectos de preservação, em copiar um determinado objecto digital em vários formatos padrão, no momento da sua aquisição, diminuindo assim o risco de corrupção e os custos, nos constantes planos de preservação. No caso de repositórios, estes já devem de exigir cópias em vários formatos padrão aos autores ou produtores dos objectos digitais.

Independentemente da estratégia adoptada, a preservação a longo prazo dos objectos digitais envolve a criação/adopção e manutenção de meta-informação. Pois os metadados acompanham e fazem referência a cada objecto digital, apresentando informação descritiva, administrativa, de preservação, ou outra. A meta-informação para a preservação é uma área de pesquisa muito activa, que está em constante desenvolvimento pela comunidade internacional de arquivos e bibliotecas digitais, assim como para os repositórios de informação.

Se as organizações começarem a adoptar as mesmas plataformas, o recurso à meta-informação, uso dos mesmos formatos “padrão” de objectos, entre outras especificações – tudo isto de uma forma uniformizada, poderá haver lugar a uma maior interoperabilidade entre as organizações, redistribuindo-se mais facilmente novas tarefas entre os cooperantes de um determinado núcleo ou mesmo um espaço geográfico, como forma de poupar espaço e recursos. Actualmente, um dos grandes entraves à preservação em grande escala por parte das organizações deve-se à falta de consciência no que respeita à necessidade de preservação por partes destas, e por outro lado, o poder económico da indústria de hardware e software, onde o interessa destes passa monopolização dos utilizadores na adquisição de actualizações constantes ou novas versões de recursos informáticos, acelerando desta forma a dimensão deste problema. Neste momento os governos e das próprias empresas não estão sensibilizados para investirem nesta área tão específica, quanto útil para o próprio desenvolvimento económico dos próprios países, que recorrendo aos serviços Web facturam biliões de euros.

Relativamente à Internet, a grande salvação passa pelo desenvolvimento das linguagens estruturadas como o XML e o RDF, veja-se como exemplo desta aplicação, o projecto OMNIPAPER: Smart Access to European Newspapers, o qual, utilizando estas duas linguagens, criou duas plataformas de descrição dos objectos, criando assim uma grande interoperabilidade no acesso a estes recursos específicos. A Web Semântica, com os constantes estudos, pode trazer grandes surpresas, pois a optimização destas linguagens, uma melhor definição das ontologias à escala mundial, a readaptação de novos métodos para estruturar a descrição dos objectos, pode tornar muito mais fácil às Instituições proceder à recuperação e preservação dos objectos digitais, assim como o seu posterior acesso.


Na actualidade, a preservação digital só é verdadeiramente assumida por um reduzido número de entidades com um elevado poder económico. Metaforicamente pode-se dizer que a preservação digital é como um conjunto de ilhas dessincronizadas, normalmente operando de uma forma individual, pelo menos os grandes projectos, sem que haja uma entidade que assuma o verdadeiro papel de liderança para promover conferências, trocas de experiências, fóruns, centros de pesquisa, estabelecimento de normas e padrões universais, etc. Só com a cooperação à escala mundial é que a preservação digital poderá ser uma realidade mais concreta, envolvendo tanto os produtores como os utilizadores dos objectos digitais.

Outra solução passa por criar empresas que mediante o pagamento de uma taxa sobre o volume de informação e de negócio realizado através da Internet, recolham a informação e estabeleçam estratégias para a preservar a longo prazo, mantendo a confidencialidade sobre os dados, criando perfis de acesso mediante acordo com a instituição produtora.

Portugal está dar os primeiros passos no que toca à investigação nesta problemática, levando já um atraso em termos de investigação, de pelo menos 6 a 8 anos. O que nos resta agora é aproveitar o resultado das diversas experiências que foram desenvolvidas um pouco por todo o mundo, tomando-se as melhores opções de uma forma racional e adquada à realidade de cada projecto.

Não querendo ser utópico, estou em dizer que tanto a Biblioteca Nacional como o próprio Ministério da Cultura, deveriam apostar numa verdadeira estratégia de preservação a ser aplicada aos conteúdos de interesse nacional. Resta decidir onde recolher os conteúdos. O ponto de partida poderá ser o domínio “.PT”, pois este corresponde a sensivelmente 75% dos conteúdos nacionais que se encontram na Web. Mesmo ao nível concelhio, as Câmaras Municipais deviam tomar medidas como forma de preservar os objectos produzidos regionalmente, pois estes podem ser de grande relevo para a memória de uma comunidade inserida num espaço geográfico, num determinado contexto e numa determinada fracção temporal.

Concluíndo, pode dizer-se que ainda há muito a fazer nesta área, ou melhor dizendo, está quase tudo por começar, pois nesta área são poucos os factos que já são certezas. Já existe algum trabalho feito, mas ainda não existe uma avaliação rigorosa sobre a situação actual à escala mundial. A UNESCO apresentou uma carta para a preservação do património digital, mas agora só falta saber se essas mesmas indicações estão a ser seguidas pelas organizações, ou se ela é em si mesma, uma proposta redutora.