PageRank Sistema de Recuperação de Informação da Área Médica: CONCEITO DE SISTEMA DE RECUPERAÇÃO DA INFORMAÇÃO

Páginas

Pesquisa

terça-feira, 9 de novembro de 2010

CONCEITO DE SISTEMA DE RECUPERAÇÃO DA INFORMAÇÃO

USP- Departamento de Biblioteconomia e Documentação
Disciplina: Representação Descritiva I - 2o semestre 2006
Docente: Cristina Dotta Ortega

UMA TEORIA DOS SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO

Um sistema de recuperação de informação (SRI) pode ser definido como um conjunto de dados padronizados, armazenados em meio eletrônico, utilizados para identificar informação e fornecer sua localização.
Dito de outro modo, a meta de um sistema de informação é permitir que um usuário recupere documentos através de certas características específicas (por autor, título conhecido, assunto ou qualquer combinação desses elementos).
A maneira mais primária de conseguir informação contida em documentos é inspecionar todos os documentos, um a um, até que sejam encontrados todos os documentos com as informações desejadas.
Uma maneira mais eficiente de encontrar a informação é consultar sistemas que contenham substitutos de documentos.
Portanto, são necessárias operações de fabricação desses substitutos, ou seja, fabricação de representações, quais sejam, as informações documentárias.
Esses substitutos listam as características através das quais os documentos podem ser procurados e são arranjados de tal forma que todas e cada uma destas características possam ser examinadas individualmente ou em qualquer combinação desejada.
Esse procedimento consiste em dividir o universo de documentos em subunidades administráveis. Assim, um sistema de informação não trata necessariamente de documentos reais, nem se preocupa com sua transmissão física ao usuário. (Embora esta atividade seja possível hoje com os links aos documentos eletrônicos).
Os documentos físicos são armazenados e relacionados aos substitutos por meio de uma subrotina do sistema ou são colocados em uma instituição de armazenagem de documentos.
Portanto, um sistema de informação tem uma saída S, que consistirá em uma lista ordenada de substitutos de documentos que satisfaçam as seguintes condições:
  1. Os substitutos dos documentos devem identificar cada documento de maneira única (por meio da descrição bibliográfica).
  2. Os substitutos devem ser registrados por símbolos que sejam conhecidos tanto pelos operadores quanto pelos usuários do sistema.
  3. Os substitutos dos documentos devem ser ordenados em seqüência universalmente conhecida, como: alfabética, numérica, alfanumérica (por meio da elaboração dos pontos de acesso, os quais formam os índices).
  4. Se nenhum documento novo é colocado no sistema, este manter-se-á em estado de equilíbrio, pois nada perturbará o arranjo dos substitutos dos documentos nos vários arquivos mantidos no sistema.

Processos típicos de um sistema de informação:
a)      função descritiva orientada a para forma física e identificação do documento (catalogação)
b)     função descritiva orientada para o conteúdo (indexação, classificação, condensação)
c)      transcrição dos dados descritivos em um substituto do documento (representação)
d)      arranjo seqüencial destas representações
e)      função de exploração do sistema

Dessas funções, a função descritiva orientada para a forma física e para a identificação do documento, a transcrição dos dados (representação) e o arranjo podem ser submetidos a pleno controle, governado por regras aplicáveis de maneira genérica.
A função de descrição orientada para o conteúdo e a função de exploração não são inteiramente controláveis. Dessa maneira, pode-se afirmar que há limites na recuperação da informação.

Recuperação da informação:
O conceito de recuperação da informação está relacionado ao conceito de controle bibliográfico.
O termo controle bibliográfico, segundo Wellisch, foi introduzido na área em 1949, por Egan e Shera, no artigo “Prolegomena to bibliographic control”. O termo não foi definido formalmente, mas caracterizado operacionalmente enquanto processo que proporciona acessibilidade ao conteúdo do documento e acessibilidade física ao mesmo.
Egan e Shera procuraram substituir o termo “controle” por “organização”, temendo uma indesejável associação com censura. Porém, o termo fixado foi “controle”.
O termo foi formalmente definido pela UNESCO e pela Library of Congress como o domínio sobre os registros escritos e publicados, suprido pela Bibliografia (cuja iniciativa pioneira se deve a Otlet por meio do Repertório Bibliográfico Universal-RBU).
Em 1968, Wilson distinguiu o controle descritivo (características formais do documento) do controle temático. Ao fazer tal distinção, afirma que, pelo menos em teoria, o controle descritivo pode ser feito de maneira completa, mas somente de forma parcial no domínio do conteúdo.
No entanto, há pessoas que acreditam que, tendo instrumentos de controle potentes, seria possível a realização do controle completo. Afirma-se que o controle completo dependeria apenas da utilização de computadores cada vez mais potentes e rápidos, dotados de inteligência, portanto com habilidade para reconhecer significados em contextos.
A melhor compreensão da natureza dos elementos descritivos dos documentos, os rápidos progressos da tecnologia da comunicação e a cooperação internacional, tem tornado viável a obtenção do controle descritivo de qualquer documento.
Nesse sentido, em 1971, o Controle Bibliográfico Universal (CBU), um termo cunhado por Kaltwasser, foi adotado pela FIAB (Federação Internacional de Associações de Bibliotecários), como política oficial. O objetivo do CBU era o de tornar universal e imediatamente disponível, numa forma internacionalmente aceitável, os dados bibliográficos básicos de todas as publicações editadas em todos os países.
A idéia de controle bibliográfico certamente não é nova. Já na Renascença, Conrad Gesner (considerado o pai da Bibliografia), tentou em sua famosa “Bibliotheca Universalis”, publicado em 1545, listar os trabalhos de “todos os autores contemporâneos e passados, antigos e novos, eruditos e populares, publicados e depositados em bibliotecas”.
Porém, mesmo na época de Gessner, quando o número de trabalhos era relativamente pequeno, se comparado com o presente, essa meta se revelou enganosa. Não era possível não só listar descritivamente tudo, como era ainda menos possível explorar seu conteúdo temático de maneira exaustiva e abrangente. Mesmo assim, essa impossibilidade era atribuída à ausência de métodos e recursos técnicos adequados.
Com o advento dos computadores, pensou-se que essa meta poderia ser facilmente alcançada. O trabalho de indexadores e resumidores humanos seria substituído por processos automáticos de indexação e elaboração de resumos. O trabalho ganharia em velocidade e precisão, garantindo o controle temático total e sua recuperação.
Para contestar isso, não é necessário ir muito longe: a Teoria Geral dos Sistemas permite-nos compreender os limites dessa utopia.
Pode-se lançar mão, primeiramente, das noções de regulação e controle num modelo de sistema:
-         Existe um sistema aberto num ambiente A. O sistema tem uma saída S que, para manter o sistema viável, deve ser mantido dentro de certos limites.
-         O sistema recebe entrada de dados do exterior. É claro que a entrada constitui sempre uma perturbação D, que ameaça o estado de equilíbrio de S.
-         Para controlar o equilíbrio da saída S, o sistema deve ter um dispositivo de controle C e um regulador R, de modo a formar um subsistema S1, cuja finalidade é controlar o fluxo de variedade ameaçadora ou indesejável entre D e S.

A idéia importante aqui é que todo sistema aberto necessita de mecanismos de controle para manter sua eficácia. Se pensarmos em um sistema de informação, quais são os mecanismos reguladores necessários?

Baseado em texto didático de Nair Kobashi (ECA/USP) (maio 2006)
WELLISCH, H. H. Uma teoria dos sistemas de recuperação da informação. Brasília: IBICT, 1987.

Nenhum comentário:

Postar um comentário