Motor de cerca

(S'ha redirigit des de: Cercador)

Un motor de cerca o de recerca o bé cercador[1][2] és un programa informàtic dissenyat per ajudar a trobar informació emmagatzemada en un sistema informàtic com ara una xarxa, Internet, un servidor o un ordinador personal. L'objectiu principal és el de trobar altres programes informàtics, pàgines web i documents, entre d'altres.

A partir d'una determinada paraula o paraules o una determinada frase, l'usuari demana un contingut sota un criteri determinat, i llavors recupera una llista de referències que compleixen aquest criteri. El procés es realitza a través de les metadades,[3] elements que permeten recuperar informació als motors de cerca. Els índexs que utilitzen els cercadors sempre estan actualitzats a través d'un robot web per generar rapidesa i eficàcia en la recerca. Els directoris, en canvi, són gestionats per editors humans.

Tipus de cercadorsModifica

  • Índexs o directoris: Són repertoris de pàgines web ordenats per temàtiques. El seu ús és simple i senzill, només cal anar clicant sobre les categories i subcategories. L'ordre l'estableix una persona, no una màquina, és a dir, el criteri acostuma a ser subjectiu.
  • Motors de cerca: Són cercadors que, a través d'un robot anomenat aranya,[4] rastregen Internet recol·lectant pàgines web i introduint-les a la base de dades automàticament. La característica principal és que aquesta cerca es du a terme a partir d'una paraula clau. Els principals motors de cerca són Google, Yahoo! i Bing, entre d'altres.
  • Multicercadors o metacercadors: Busquen pàgines web en diferents cercadors, i combinen els resultats que obtenen. Els multicercadors no disposen de bases de dades pròpies. Dos exemples de multicercadors són Metasearch i MetaCrawler.
  • FFA (Free For All):[5] Aquests cercadors són gratuïts i permeten que l'usuari pugui inscriure-hi la seva pàgina web durant un temps limitat. No és permanent.

Cercadors jeràrquics (aranyes o spiders)Modifica

Un rastrejador web, indexador web, o aranya web és una programa informàtic que inspecciona les pàgines de World Wide Web de forma metòdica i automatizada.[6] Un dels usos més freqüents que se'ls dóna consisteix a crear una còpia de totes les pàgines web visitades per al seu processament posterior per un motor de cerca que indexa les pàgines proporcionant un sistema de recerques ràpid. Les aranyes web solen ser bots.[7]

Les aranyes web comencen visitant una llista d'URL, identifica els hiperenllaços en aquestes pàgines i els afegeix a la llista d'URL a visitar de manera recurrent d'acord a determinat conjunt de regles. L'operació normal és que se li dóna a el programa un grup d'adreces inicials, l'aranya descàrrega aquestes adreces, analitza les pàgines i busca enllaços a pàgines noves. Després descàrrega aquestes pàgines noves, analitza els seus enllaços, i així successivament.

Entre les tasques més comunes de les aranyes del web tenim:

  • Crear l'índex d'una màquina de cerca.
  • Analitzar els enllaços d'un lloc per buscar links trencats.
  • Recol·lectar informació d'un cert tipus, com preus de productes per recopilar un catàleg.

DirectorisModifica

Un directori web és un tipus de lloc web que conté un directori organitzat de dades, imatges o, més generalment, enllaços a altres llocs web. Els directoris web, contràriament als motors de cerca, es caracteritzen per estar estructurats en categories i subcategories. Habitualment, els directoris web permeten als administradors web o creadors de llocs web que informin del seu lloc perquè sigui inclòs, i després els editors autoritzats revisen aquestes sol·licituds abans d'incloure les seves enllaços per comprovar que s'adeqüen als requisits d'acceptació determinats pel directori web.[8]

Entre els directoris web generalistes més coneguts es poden esmentar el Yahoo! Directory (inactiu des 2014) i DMOZ (inactiu des 2017). En l'actualitat els directoris web supervivents són petites bases de dades especialitzades en temes concrets i per això ja no són tan populars. Els grans repertoris generalistes com van ser Yahoo! Directory o DMOZ ja han estat definitivament reemplaçats pels motors de cerca, principalment el cercador de Google.

Els directoris web regionals integren en un mateix lloc a comerços, serveis, empreses o participants de determinat sector, enfocant-se en un territori comercial en específic, creant d'aquesta manera una comunitat que facilita la navegació, localització i mercadeig. Aquests directoris promouen el creixement econòmic de el sector a què estan enfocats ja que posen a l'abast de l'usuari la possibilitat de descobrir proveïdors que desconeixia que existissin i amb això resoldre una necessitat de compra.

Una tecnologia molt simple per gran quantitat de scripts disponibles, ja que no es requereixen molts recursos. En canvi, es requereix més suport humà i mantenimient.[9]

MulticercadorsModifica

Un metacercador és un sistema que localitza informació en els motors de cerca més usats, no té base de dades pròpia pel que fa servir les d'altres cercadors i mostra una combinació de les millors pàgines que ha cada un.[10] Un cercador normal recopila la informació de les pàgines mitjançant la seva indexació, com Google o bé manté un ampli directori temàtic, com Yahoo. La definició simplista seria que un metacercador és un cercador en cercadors.

«En altres paraules per al·ludir a el concepte més genèric d'un cercador, podem afirmar que un metacercador és el cercador que incorpora un conjunt de cercadors. Alguns exemples de metacercadors són: Dogpile, Aleyares [11] MetaCrawler, entre d'altres. Aquests metacercadors presenten avantatges, com ampliar l'espai de recerca i en alguns casos mostrar la posició del web ».[12]

HistòriaModifica

El primer cercador va ser "Wandex", un índex realitzat pel World Wide Web Wanderer, un robot desenvolupat per Mattew Gray al MIT, el 1993. Un altre dels primers cercadors, Aliweb, també va aparèixer en 1993 i encara està en funcionament. El primer motor de cerca de text complet va ser WebCrawler, que va aparèixer el 1994. A diferència dels seus predecessors, aquest permetia als seus usuaris una recerca per paraules en qualsevol pàgina web, el que va arribar a ser un estàndard per a la gran majoria dels cercadors . WebCrawler va ser així mateix el primer a donar-se a conèixer àmpliament entre el públic. També va aparèixer en 1994 Lycos (que va començar a la Carnegie Mellon University).

Molt aviat van aparèixer molts més cercadors, com Excite, Infoseek, Inktomi, Northern Light i Altavista. D'alguna manera, competien amb directoris (o índexs temàtics) populars com Yahoo !. Més tard, els directoris es van integrar o es van afegir a la tecnologia dels cercadors per augmentar la seva funcionalitat.

Abans de l'adveniment de la Web, hi havia motors de cerca per a altres protocols o usos, com el cercador Archie, per a llocs FTP anònims i el motor de cerca Verònica, per al protocol Gopher.

El 1996 Larry Page i Sergey Brin van començar un projecte que portaria a l'aparició de l'cercador més utilitzat avui dia: Google. El projecte inicial es va cridar BackRub, [13] que era el nom de la tecnologia utilitzada per al seu desenvolupament.

BackRub basava la importància dels llocs web en la quantitat d'enllaços que rebia. Presentava una interfície molt senzilla i capaç de mostrar als l'usuari els resultats més rellevants per a cadascuna de les recerques.

Amb l'arribada de Google, la manera en què els motors de cerca funcionaven va canviar de forma radical, democratitzant els resultats que s'ofereixen en el seu cercador. Google va basar el funcionament del seu motor de cerca a la rellevància dels continguts de cada lloc web per als propis usuaris, és a dir, prioritzant aquells resultats que els usuaris consideraven més rellevants per a una temàtica concreta. Per a això va patentar el seu famós PageRank, un conjunt d'algoritmes que valoraven la rellevància d'un lloc web assignant-li un valor numèric de el 0 a el 10.

En la majoria de països Google.com o la versió de Google per al país concret, és el cercador més utilitzat, però, això no passa en alguns països. Per exemple, a Rússia el cercador més utilitzat és Yandex.ru [14][15] i a la Xina és Baidu.[16]

Cercadors en catalàModifica

Vegeu tambéModifica

ReferènciesModifica

  1. IDEC. Manuals d'ajuda. 15-03-2014.
  2. Apunts del curs d'Internet. Òmnia, accés a les noves tecnologies. Consultat el 15-02-2010
  3. Metadades. Diputació de Barcelona. http://www.diba.cat/web/idebarcelona/metadades
  4. Snowden utilizó una araña web para conseguir documentos de la NSA. Yahoo! Noticias.
  5. Historia de la informática. http://histinf.blogs.upv.es/2011/01/11/1808/
  6. Kobayashi, Mei; Takeda, Koichi «Information retrieval on the web». ACM Computing Surveys, 32, 2, 01-06-2000, pàg. 144–173. DOI: 10.1145/358923.358934. ISSN: 0360-0300.
  7. «Scutter - FOAF Wiki», 13-12-2009. [Consulta: 9 novembre 2020].
  8. «Directorio Web - EcuRed» (en castellà). [Consulta: 9 novembre 2020].
  9. «Tema 1.4. Directorios temáticos». [Consulta: 9 novembre 2020].
  10. «Google Llibres». [Consulta: 9 novembre 2020].
  11. Curiel, Raúl López. Las TIC en el aula de Tecnología. Guía para su aplicación a la metodología de proyectos (en castellà). Lulu.com, 2014-02. ISBN 978-1-291-60929-5. 
  12. Vargas Osorno, Teresa Genoveva, Bancos de datos jurídicos. Pasado, presente y futuro.. Bancos de datos jurídicos. Pasado, presente y futuro. (Tesi) (en castellà). UCM: Universidad Complutense de Madrid, 2015, p. 441. 
  13. «Historia de los motores de búsqueda. Los inicios de Google.» (en castellà), 18-09-2016. [Consulta: 9 novembre 2020].
  14. «Los principales motores de búsqueda en Rusia: Yandex, Google.ru, Mail.ru y Rambler» (en castellà), 13-11-2013. [Consulta: 9 novembre 2020].
  15. «Cómo es Yandex, el poderoso buscador que le gana la partida a Google en Rusia» (en castellà). BBC News Mundo.
  16. País, Ediciones El. «¿Cómo se busca sin Google en el internet chino?» (en castellà), 03-08-2018. [Consulta: 9 novembre 2020].

Enllaços externsModifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Motor de cerca