PageRank Sistema de Recuperação de Informação da Área Médica: ESTRATÉGIA DE BUSCA NA RECUPERAÇÃO DA INFORMAÇÃO: REVISÃO DE LITERATURA

Páginas

Pesquisa

quarta-feira, 10 de novembro de 2010

ESTRATÉGIA DE BUSCA NA RECUPERAÇÃO DA INFORMAÇÃO: REVISÃO DE LITERATURA



LOPES, Ilza Leite. Estratégia de busca na recuperação da informação: revisão da literatura. Revista de Ciência da Informação de Brasília, Brasília, v.31, n.2, p. 60-71, maio/ago. 2001.


Os sistemas de recuperação da informação possibilitam o planejamento de estratégias de busca com maior nível de complexidade envolvendo vários conceitos na mesma estratégia; permitem a utilização de busca de palavras apenas dos títulos e resumos dos documentos, isto é, termos da linguagem natural; buscam os termos específicos de linguagens controladas, nos campos de descritor; buscam por autores; por ano de publicação; por título de periódicos; por classificação permitem, também a busca de conceitos compostos ou simples e a possibilidade de truncagem de raízes de palavras e de substituição de caracteres no meio dos termos, dentre outros recursos de recuperação.
A evolução histórica dos sistemas de recuperação da informação, segundo Lancaster (1993, p.202) apresenta duas linhas principais de desenvolvimento. A primeira tem suas origens nos grandes sistemas de bases de dados desenvolvidas pelas instituições americanas: National Library of Medicine (NLM), Department of Defense (DOD) e pela National Aeronautics and Space Administration (Nasa), que indexava suas bases de dados referenciais utilizando os thesauri específicos de suas áreas temáticas. A segunda linha teve o seu desenvolvimento no campo do direito e envolvia a geração de dados com o texto completo das leis.
O conteúdo de informações em banco de dados variam de acordo com a diversidade temática das respectivas bases de dados oferecidas em cada banco. Algumas são orientadas para um determinado assunto, enquanto outras são orientadas para a missão da instituição que as desenvolvem.  Tais fatores devem ser levados em consideração no planejamento das estratégias de busca, assegurando a qualidade na recuperação da informação.
Tais fatores levaram a um estudo de planejamento e elaboração de etapas de estratégias de busca em base de dados em linha e em CD-Rom.

Estudo da Estratégia de Busca   

Alguns conceitos fundamentais são apresentados para o entendimento da questão relacionada com o processo de planejamento das estratégias de buscas, definindo-se os principais, como citados no Dicionário Aurélio Eletrônico:

Estratégia: 1) arte militar de planejar e executar movimentos e operações de tropas, navios, e/ou aviões, visando a alcançar ou manter posições relativas e potenciais bélicos favoráveis e futuras ações táticas sobre determinados objetivos; 2) arte militar de escolher onde, quando e com que travar um combate ou uma batalha; 3) arte de aplicar os meios disponíveis com vista á consecução de objetivos específicos.

Busca: 1) ato ou efeito de buscar, 2) procura com o fim de encontrar alguma coisa; 3) investigação cuidadosa: pesquisa, exame, 4) procura, minuciosa: revista, exame; 5) movimento íntimo para alcançar um fim.

Tática: 1) parte da arte da guerra que trata da disposição e da manobra das forças durante o combate ou na iminência dele; 2) parte de arte da guerra que trata de como travar um combate ou batalha; 3) fig. Processo empregado para sair-se bem num empreendimento.

No âmbito da recuperação da informação, a estratégia de busca pode ser definida como uma técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados. Isto significa que, a partir de um arquivo, um conjunto de itens que constituem a resposta de uma determinada pergunta será selecionado.
A partir desses conceitos, pode-se inferir que, para alcançar a resposta pretendida pelo usuário de informação, faz-se necessário a execução de movimentos e operações táticas, ora restringindo os resultados alcançados, ampliando-os para a obtenção de informações mais relevantes, conforme o pedido de busca demandado.
Bourne (1977) investigou o impacto dos erros ortográficos nas bases de dados bibliográficas e como eles afetam a produtividade das buscas em linha. Analisou erros ortográficos que ocorrem na linguagem natural, isto é, nos campos de títulos e resumos, assim como que ocorrem nos campos de descritores das linguagens controladas. Ele observa, entretanto que a quantidade de erros ortográficos, formas variante de palavras e mesmo erros ortográficos termo de indexação afetam consideravelmente os resultados das buscas. Lembra que, no índice impresso, essa alta incidência de erros ortográficos não é tolerada e, portanto, a mesma atitude deve ser mantida quanto ao índice das bases de dados.
Constata-se que o usuário final está pouco habilitado a lidar com incidência de erros ortográficos em bases de dados. O intermediário dispõe de maior habilidade para utilizar linguagens controladas, pois obtém conhecimento prévio desses para o planejamento e operacionalização da estratégia de busca.
Fidel (1986) em seu estudo sobre sistema especialistas desenvolvidos para auxiliar os usuários finais na consulta as bases de dados, demonstrou que a maioria desses sistemas é baseada na análise dos textos, e não nos modelos de busca humana. Por esse motivo, tais sistemas não podem processar os critérios relacionados como o pedido de busca do e responder as questões relativas aos fatores de revocação e precisão.
Bates (1987, 1988) conceituou estratégia de busca como o estudo “estudo de teoria, princípios e práticas de planejar e executar táticas e estratégias de busca”. Adaptando as definições ao ambiente de recuperação da informação, deu ênfase ao conceito de comportamento de busca, indagando: “o que as pessoas fazem, e como pode se determinado o que elas pensam, quando estão executando uma busca de informação?”
Nesse momento, cabe uma análise semântica dos principais termos que compõe o objeto de estudo, lembrando que o planejamento e a execução de um estratégia de busca é a  “arte de escolher onde, quando e com que investigar cuidadosamente” a fonte de informação para alcançar os objetivos específicos do solicitante, dependendo de uma serie de fatores relacionados com a abrangência de assunto e período da base, dos tipos de documentos indexados, da linguagem de indexação, dos campos de busca disponibilizados em determinado banco de dados.
Ela também observou que o processo de busca é efetuado por pessoas é constituído por diferentes movimentos, táticas, estratagemas e estratégias. Definindo o movimento como um pensamento ou ação que é parte do processo de busca, demonstrou que a tática é composta por um ou mais movimentos executados no mesmo processo. O estratagema seria constituído pelo uso de múltiplas táticas ou movimentos, e a estratagemas para a completa busca da informação. O processo de busca realizado pelo sistema de recuperação seria composto, entre outros, pela linguagem de busca do sistema e pela estrutura de informação da base de dados.
Spink e Saracevic (1993) afirmaram, baseados na prática profissional e em pesquisas, que a busca em sistemas de recuperação de informação é:
“Um processo de alta complexidade envolvendo numerosos fatores e variáveis além de decisões e o entrelaçamento dos subprocessos inter-relacionados com a busca”. Uma das chaves para um dos subprocessos é a seleção de termos para a estratégia de busca que por sua vez é influenciada por outros fatores, particulares os relacionados com os resultados. Sintetizam essa questão com uma pergunta para as investigações : Que termos de busca devem se selecionados para um determinado tema que represente efetivamente o problema de informação do usuário?” (Spink  e Saracevic, 1993, p.63).
Tais questões foram analisadas para a identificação de: padrões do discurso interativo entre os usuários e os intermediários; efeitos de diferentes variáveis no processo de recuperação e de obtenção dos resultados; guias para melhorar o desempenho das interações entre os mesmos; padrões de seleção dos termos para a estratégia de busca e da seqüência da escolha dos mesmos e das fontes desses termos.
Diversas aplicações praticas podem ser mencionadas no contexto de recuperação em bases de dados. As primeiras estão relacionadas com os intermediários que operacionalizam as buscas, pois os mesmos devem ter o conhecimento continuamente aprofundado sobre as diferentes fontes de linguagens controladas e sua estruturas hierárquicas ou não, para que os termos ou conceitos da estratégia de busca sejam os termos utilizados pelos indexadores no processo de entrada dos documentos na base.
A segunda esta diretamente relacionada com os usuários, que devem ser informados detalhadamente sobre todo o processo de busca. Dessa forma, eles poderão participar ativamente dessas ações, compreendendo sua complexidade, as limitações das bases de dados e as interações que devem ser efetuadas para o alcance dos resultados desejados da busca. E a terceira implicação esta relacionada com o processo de entrevista, quando devem ser explicada ao usuário todas essas negociações com as bases e os sistemas visando a assegurar a compreensão do problema e a utilização de todos os termos ou conceitos possíveis de serem usados na estratégia de busca para a obtenção de resultados satisfatórios.   
Apesar dos intensivos programas de treinamento oferecidos pelos produtores das bases de dados, pelos próprios sistemas de recuperação em linha, de toda a documentação existente sobre as características de cada base de dados e sua respectivas estruturas de informação, dos sistemas amigáveis que oferecem “menus” para guiar o usuário em cada etapa do processo de busca, da linguagens de busca com recurso especiais  para se aproximarem cada vez mais do usuário inexperiente, o processo de busca continua apresentando um fator de dificuldade que ainda não foi minimizado pelas novas tecnologias disponíveis.

Técnicas de Estratégia de Busca

No planejamento da estratégia de busca, algumas ações ou táticas precisam ser criteriosamente relacionadas, principalmente com a seleção de termos ou conceitos e com as restrições ou limites determinados pelo solicitante ente outras questões.
Bates (1974 e 1979) conceituou tática como um plano idealizado para a efetivação de uma busca, sendo que esse plano pode ser bem-sucedido ou não. A autora definiu e analisou cerca de 13 táticas de busca dentre eles as de registros, de levantamento, de vizinho, de “resoletar” e de reespaçar”.
Dolan (1980), Schiffman (1985) e Curnutt (1991) descrevem uma técnica de busca denominada “hedges”, desenvolvida pela National Library of Medicne, que consiste no agrupamento de um conjunto de termos de busca, específicos de um assunto para futura utilização, e que pode ser aplicada em qualquer área de assunto. Esses “hedeges” são escolhidos para definir grupos de termos relacionados que ocorrem em vários níveis de hierarquias das linguagens controladas e, normalmente, não estão reunidos nos diversos thesauri sob um mesmo conceito.
Hawkins (1978) e Hawkins e Wagers (1982) apresentaram algumas técnicas para formulação da estratégia de busca e foram assim intitulados: construção em bloco, fracionamento sucessivo, crescimento da pérola de citação de pesquisa interativa. Essa técnica representa apenas a parte mecânica da estratégia. São extremamente úteis para ajudar no raciocínio lógico usado como os operadores boleanos, mas não substituem o processo associativo feito anteriormente, no momento da identificação dos conceitos e suas relações.
Fidel (1985, p. 62) definiu o modelo operacionalista como “um movimento que usa as características do sistema de recuperação com o objetivo de modificar o conjunto recuperado sem mudar o significado conceitual que ele representa”. Ao passo que o modelo conceitualista é definido como aquele que modifica o conjunto recuperado pela mudança de significado do conceito que ele representa.  Analisando a estratégia de busca em bases de dados em linha, a autora detectou todas as etapas de operacionalização das estratégias, denominadas a técnica de “mover”. Afirmou que a mais importante vantagem da busca em linha é “que os intermediários podem revisar suas estratégias definidas anteriormente ao longo do processo de busca em qualquer etapa da mesma”. A técnica “mover está diretamente relacionada com os dois estilos de busca: operacionalista ou coneitualista. 
Todos esses      “movimentos” foram examinados e relacionados com as táticas de busca definidas por Bates (1974) e com as técnicas de estratégias de busca preconizadas por Markey e Atherton (1978) e por Hawkins  e Wagers (1978).
Kirkbride (1991) mencionou alguns dos critérios para seleção de bancos e bases de dados, alertando para as dificuldades inerentes ao processo de escolha dos termos para a estratégia de busca. Afirmou que a formulação de estratégias de busca depende do tema de pesquisa e da linguagem de busca dos diversos bancos de dados em disponibilidade. Portanto, é necessário um conhecimento minucioso das técnicas de estratégia de busca, dos prós e contras da estratégia no texto completo dos documentos, da busca em linguagem controlada, da política de indexação, da cobertura de assunto das bases de dados e das características das linguagens de recuperação dos diversos sistemas disponíveis. Em algumas ocasiões, um tema de pesquisa ou um tipo de formato solicitado exigem uma pré-seleção da base e do banco de dados, antes mesmo de se planejar qual técnica será usada na formulação da estratégia de busca.
A implementação da estratégia de busca, portanto, requer do intermediário pré-requisitos intelectuais e pessoais para operacionalização da mesma, por exemplo, raciocínio   lógico, autoconfiança, serenidade, além de outros atributos citados na literatura especializada.   

Estratégias de Busca - Etapas

Oldroyd e Citroen (1977) identificaram três grandes etapas para decisão no processo de planejamento da estratégia de busca: decisão sobre qual a melhor base de dados para um determinado tema; decisão referente á seleção dos termos de busca e sua adequação para a base a ser consultada; decisão sobre a formulação lógica da estratégia.

1º Etapa: Discussão do tópico geral da pesquisa  

Uma entrevista pode eliminar muitos problemas. Se o tópico da busca não tiver sido bem definido e descrito pelo usuário, é tarefa do intermediário ajudar a fazê-lo. É útil perguntar como os resultados da busca irão ser aplicados, porque e a resposta pode mudar a direção ou a ênfase da busca.

 2º Etapa:Conhecimentos básicos sobre os instrumentos de busca

 Se o pesquisador se familiazar com alguns dos instrumentos básicos de auxílio para a busca em seu campo, por exemplo, um thesauri, isto pode ajudar a definir o tópico e gerar uma lista de palavras-chave a serem usadas na estratégia de busca. O pesquisador deve selecionar os termos que especifiquem o problema por causa do seu grande conhecimento do assunto; o intermediário dever ajudar, mas não deve definir o assunto, porque, na maioria das vezes, a definição obtida para o tema difere completamente do pesquisador.

3º Etapa: Formulação “provisória” da estratégia de busca

Após o pesquisador ter fornecido um tópico claro e descritores válidos, o intermediário pode formular uma estratégia de busca inicial (tentativa). A busca está bem definida se o intermediário for capaz de assegurar a recuperação de todas as citações para vários termos. Mas, tipicamente a informação mais complexa, aquela que requer a interseção de, pelo menos, dois conjunto de termos, é desejável. Neste caso, o intermediário tem que ajudar o pesquisador a agrupar termos similares em um só conjunto e, sucessivamente, pode agrupar outros termos similares em outros conjuntos até alcançar a resposta solicitada. Porém, é realmente desejável é que a informação solicitada ocorra em ambos os conjuntos ao mesmo tempo.

4 Etapa: compreensão da lógica dos conjuntos de termos

O intermediário deve ajudar o usuário a compreender as propriedades básicas da teoria dos conjuntos tal como é usada nas estratégias de busca por computadores. O uso da interseção de mais de dois conjuntos de termos deve ser evitado, porque, embora os resultados possam ser bem precisos, eles são muito limitados e podem provocar uma possível exclusão de informações relevantes.

5º Etapa: Interdisciplinaridade

Os intermediários que executam a busca nos sistemas precisam conhecer sobre os campos de pesquisa correlatos e como usá-los para responder a questões que demandam buscas interdisciplinares. Frequentemente o pesquisador não está familiarizado com campos de pesquisa relacionados; cabe, portanto, ao intermediário propor a expansão da busca para estes outros campos, aumentando, consequentemente, as possibilidades de documentos de interresse virem a ser recuperados.

6 Etapa: Eliminação de termos indesejados

Existem várias maneiras de se eliminarem termos indesejados de uma busca. Se o pesquisador não está interessado em citações sobre um determinado conceito, o intermediário pode eliminar do resultado final todas as citações que tiverem o termo citado. Mas existem problemas com este enfoque. Ocasionalmente, ambos os termos ocorrerão na mesma citação. Nesse caso, o solicitante deve ser avisado sobre esses possíveis problemas. Com o solicitante, o intermediário examinará a necessidade de exclusão de termos afins com o tema pesquisado. Os termos indesejados serão excluídos do resultado da busca depois de se ver o impacto dessa exclusão no resultado total da busca. A decisão para excluir termos nem sempre é fácil e, visualmente, depende da especificação do tópico.

7 Etapa: Especificação dos parâmetros relevantes para a execução da busca

Todos os parâmetros relevantes devem ser considerados para se determinar os limites da busca. Quanto, em termos de recursos financeiros, pode ser gasto na busca?
Deve a busca ser limitada nos anos mais recentes? Quais as bases de dados que provavelmente irão fornecer as mais relevantes citações? O pesquisador que todas as citações que mencionam uma autoridade particular ou somente as que são autorizadas por uma pessoa particular?
O pesquisador deve responder a estas questões, devidamente assistido pelo intermediário nessa tomada de decisão, que anotará todos os detalhes para o posterior planejamento da estratégia de busca.

Comentário

No contexto atual a tecnologia ampliou o escopo da pesquisa. Os bancos de dados armazenam inúmeros dados facilitando a busca de informação.
A pesquisa em base de dados permite ao usuário recuperar uma informação a qualquer hora em qualquer lugar independente de sua localidade geográfica, o que antes de surgir tal tecnologia era uma grande barreira na busca de informação.
Mas o grande desafio hoje é obter qualidade na busca da informação recuperada nessas bases de dados. O artigo trata basicamente de estratégia de busca e suas etapas tendo como objetivo melhorar a qualidade das informações recuperadas em bases de dados.
Para entender o processo de busca de informação em bases de dados é importante saber quais são as linguagens de recuperação utilizada.
Atualmente os bancos de dados tem utilizado sofisticados recursos em suas linguagens de busca objetivando ampliar a possibilidade de recuperação em suas bases oferecem mecanismos de analises estatísticas e bibliométricas.
Por isso o planejamento de estratégia de busca é tão importante, para que o usuário consiga alcançar resultados satisfatórios.    

Nenhum comentário:

Postar um comentário