Buscar

lunes, 20 de agosto de 2012

MOTORES DE BÚSQUEDA EN INTERNET

Cuando se habla de Internet, se suele describir en primer lugar la gran cantidad de páginas con información disponible que hay en ella, pero la parte más complicada (la búsqueda) queda siempre en un segundo plano, con desagradable sorpresa para quienes se conectan por primera vez. El navegante es el que debe de ingeniárselas para dar con la información deseada y, en muchas ocasiones, la búsqueda está llena de paradojas y situaciones extrañas, a veces frustrantes. En cualquier caso, es normal cierta confusión entre los principiantes a la hora de buscar algo en Internet: la Red está llena de información valiosa, pero también hay muchísimo material poco relevante (denominado “ruido”) que hace perder tiempo a la hora de buscar algo. Los propios sistemas de búsqueda no son perfectos, y el desconocimiento de las herramientas empeora las cosas.

Muchas veces, los usuarios terminan padeciendo lo que se denomina “angustia de la información”, porque hay demasiados datos revoloteando por el ciberespacio, imposibles de procesar (o encontrar) por un ser humano por mucho tiempo que le dedique al día; además, la tarea de encontrar “lo mejor sobre...” se convierte en una misión imposible. En ocasiones esto hace que el usuario se desespere al indagar una página o documento sobre un tema determinado, y se olvide de lo importante que es dedicar previamente unas horas (o días) a comprender exactamente cómo funcionan los sistemas de búsqueda de Internet. Si se mira de otro modo, es como aprender el funcionamiento de un nuevo software para sacarle el mayor partido: todo el tiempo empleado en esta formación es extremadamente valioso e importante.


TIPOS DE BUSCADORES

Existen varias formas o métodos de búsqueda de información, entre ellos se tomarán en cuenta los siguientes: 1.Buscadores o Motores de Búsqueda (Search Engines); 2. Foros o Grupos de Noticias (Newsgroups) y 3.Directorios de Temas (Directories).

1. Buscadores o Motores de búsqueda (Search Engines). Un Buscador o Search Engine es un programa diseñado para ayudar a encontrar información archivada en un sistema de computadoras como la gran Red (WWW). Cuando al buscador se le escribe una palabra o frase, su función es elaborar una lista de referencias que respondan a lo solicitado. Los buscadores usan amplias bases de datos actualizadas para operar en forma rápida y eficiente. La página inicial de algunos buscadores, como Google, ofrece varias opciones de búsqueda, ya sea que los resultados aparezcan en forma de páginas Web, imágenes, foros o grupos de discusión (newsgroups), noticias (news), ofertas comerciales (froogle), y varios campos más. Cada buscador tiene una ventanilla donde se escribe la palabra o frase a ser investigada. Varios buscadores poseen una versión para el idioma Español (y para otros idiomas principales); sin embargo debe notarse que las búsquedas en español restringen notoriamente la amplitud o el abanico posible de resultados. Como hemos visto anteriormente, el idioma Inglés domina significativamente la información en Internet, así que cuando nos interese una indagación en detalle, es más conveniente hacerla con palabras de búsqueda en inglés.

2. Foros de Discusión o Newsgroups. Comprenden un área de Internet dedicada a la discusión de tópicos precisos y muy variados; se inicia cuando alguien inserta una pregunta o comentario en un grupo específico y, a medida que otras personas responden, se va formando una cadena o hilo de mensajes inter-relacionados entre sí y alrededor del asunto inicial. De esta manera, pueden aclararse dudas, en donde los más conocedores transmiten sus conocimientos y experiencias. Los Grupos de Google forman un servicio gratuito de foros de debates acerca de miles de temas. Actualmente estos grupos tienen un total de más de mil millones de mensajes en el sistema de Google. En los grupos se puede participar en dos formas: a) solamente leyendo el contenido de las aportaciones de los participantes, a fin ir conociendo el sistema; y b) contribuyendo con los debates por medio del envío de proposiciones y ofreciendo respuestas. Para esto se requiere una inscripción previa y se accederá por medio de la siguiente dirección: http://groups.google.com.sv/. Cuando se esté en el sitio de Grupos de Google, se escribe la palabra o frase a investigar en la casilla que aparece.

3. Directorios de Temas (Directories). Son sitios que se especializan en referirse a otros sitios mediante su ordenamiento o jerarquización en grandes temas como Arte, Ciencias, Compras, Computadoras, etc. Los directorios son elaborados por especialistas humanos, a diferencia de los buscadores (Search engines) que son organizados por robots (sistemas automatizados). Cada herramienta se emplea de acuerdo a la naturaleza de lo investigado y a la experiencia del investigador. Por ejemplo, si se desea conocer información amplia o preliminar de algún tema se puede hacer, al principio, con un directorio y luego se emplean los buscadores u otras herramientas de investigación para llegar al detalle apropiado.


LOS BUSCADORES MÁS POPULARES



1. Yahoo

Nacido de la mano de dos estudiantes en abril de 1994 como una iniciativa para catalogar los recursos más atractivos de la World Wide Web (cuando la Web todavía era pequeña), Yahoo se ha convertido en una fructífera empresa que ofrece su servicio de forma gratuita a cambio de que el usuario vea algo de publicidad cada vez que accede para realizar una consulta. Las ventajas principales de Yahoo son su completitud, su sencilla y atractiva interfaz y su facilidad de uso. Los empleados de Yahoo examinan personalmente páginas Web y recursos de todo el mundo y las incluyen en una guía jerárquica universal. Una vez examinado el material, incorporan cada una de las páginas en una categoría predeterminada (con referencias cruzadas a otras, si es necesario), hacen un pequeño resumen de su contenido y lo publican en el catálogo general, un árbol que recoge todo lo que pueda existir, completamente organizado en más de 20.000 categorías y cientos de miles de páginas documentadas.

El árbol de Yahoo comienza con unas ramas de generalidades: Arte, Ciencia, Noticias, Informática, Juegos... y se despliega a medida que el usuario va avanzando pantallas: Arte lleva a Pintura, Escultura, Fotografía; Fotografía lleva a Fotógrafos, Biografías, Escuelas... y así sucesivamente. Los punteros finales del árbol de categorías de Yahoo no son más que enlaces a recursos de Internet: grupos de noticias de Usenet, sitios FTP, y principalmente, páginas Web. Yahoo en sí no almacena esas páginas: simplemente proporciona los enlaces HTML adecuados. Un solo clic con el ratón es suficiente para saltar a ellos gracias a la magia del hipertexto de Internet. Una primera forma de usar Yahoo sólo requiere conectarse y navegar por el árbol de categorías (por ejemplo: Entretenimiento: Cine: Películas: Directores: Quentin Tarantino: Pulp Fiction) hasta que se encuentra lo que se desea. A la derecha de cada categoría aparece siempre un número entre paréntesis que indica cuantas referencias y subcategorías contienen las siguientes subcategorías.

Otra forma de navegar por Yahoo consiste en buscar palabras clave que aparezcan en el nombre de una categoría o en la descripción de los propios recursos investigados. Esta búsqueda se puede hacer en todo Yahoo o sólo en una categoría determinada (de un nivel hacia abajo). El resultado: al buscar “Umberto Eco” (por ejemplo) aparecen páginas de categorías sobre el autor, en distintas áreas (Autores/Ficción literaria; Literatura/Semiótica) y también algunas de las páginas concretas, enlazadas hacia la WWW. Yahoo ofrece algunos detalles más que son de interés: junto a las nuevas incorporaciones a la base de datos aparece un icono destacado (“New”) durante unas semanas, así como otro icono (“Cool”, unas gafas rojas) si el sitio es especialmente interesante. (Como en todas las clasificaciones de Internet, la valoración depende del gusto de los catalogadores, pero dado el gran trabajo que realizan en Yahoo, un icono de este tipo suele ser sinónimo de calidad). Desde el menú principal de Yahoo también se puede acceder a noticias y novedades procedentes de agencias, dar saltos aleatorios por la Red en los momentos de aburrimientos o acceder a servicios personalizados, como el Yahoo para niños o el Yahoo personalizado (my.yahoo.com), que se puede configurar según gustos personales.

Consejos generales

 Examinar el árbol de categorías detalladamente para conocer la estructura del índice. Esto le ayudará a encontrar más fácilmente páginas sobre un tema determinado. Si se dedica tiempo a pedir las ampliaciones completas de los árboles de Yahoo (opción “Subcategory Listing” en cada sección) se tendrá una idea global del buscador.

 Las páginas regionales están todas bajo la denominación “Regiones, Países”.

 Para una búsqueda rápida, se usa la ventana de búsquedas y se introducirán algunas palabras, aunque se reciba algo de ruido. La opción “búsquedas avanzadas” permite usar frases lógicas (como AltaVista), para forzar o eliminar palabras no deseadas. No se debe despreciar la oportunidad de ampliar la búsqueda conectando con AltaVista desde Yahoo, una opción que se ofrece al final de cada búsqueda.


2. Altavista


AltaVista puede encontrar referencias a cualquier “palabra” que se encuentre en una página Web o mensaje público de Usenet, y dar acceso a ese recurso en cuestión de segundos, mediante un enlace desde la pantalla del navegador. El funcionamiento de un motor de búsqueda como AltaVista es sencillo, sólo se teclea una frase y se revisan los resultados; el motor de búsqueda analiza la base de datos sobre la base de conceptos tales como cuántas veces aparecen las palabras buscadas, si el contexto es el mismo (cercanía), si aparece lo buscado en el título de la página o al principio de ésta, si son palabras comunes o no, etc. Así, por ejemplo, usando la búsqueda simple (la que aparece al conectarse a la página) y tecleando una frase aparecen al instante cientos de referencias, clasificadas de mejor a peor aproximación. Lo que hace AltaVista es buscar en su índice, extraer las páginas que contienen cualquiera de esas palabras o varias de ellas y presentarlas según un criterio de aciertos, respecto a la frase de búsqueda. Un clic con el ratón sobre los resultados dirige el navegador Web a la página de destino.

A pesar de su aparente sencillez, AltaVista cuenta con opciones avanzadas para eliminar parte del “ruido” inherente a su método de almacenamiento. Esto es así porque si se busca únicamente la palabra “radio”, por ejemplo, aparecerá información tanto sobre emisoras de radio como sobre matemáticas (el radio de una circunferencia) o el radio como elemento químico: AltaVista no puede hacer mucho más... la palabra “radio” aparece más de 3 millones de veces en la WWW. Por esta razón, las búsquedas se pueden realizar de forma más estricta, incluyendo algunas instrucciones especiales, para evitar que aparezcan páginas no deseadas y concretar lo que se está buscando. El modo de “búsquedas avanzadas” de AltaVista (al que se accede a través del icono del mismo nombre, en la ventana principal) proporciona otro método de seleccionar la información. Puede acotar los aciertos por fechas, con los operadores AND y OR (similares a + y -) y con frases de búsqueda más complejas. Incluso se puede especificar la cantidad de palabras máximas de separación que debe haber entre dos palabras determinadas. Una última forma de localizar información con AltaVista es dirigir la búsqueda a Usenet. La red de grupos de noticias y debate contiene información más al día que la Web, y es fácil localizar información de usuarios particulares haciendo preguntas y dando respuestas sobre un tema concreto.

Uno de los secretos de AltaVista, fuera de la vista del usuario, es Scooter. El robot inteligente de Digital rastrea la Web constantemente, buscando enlaces en las páginas y saltando a ellos para consultarlos, indexarlos y buscar nuevos enlaces. Su trabajo no termina nunca, y permite que cada día se añadan y actualicen cientos de miles de nuevas páginas sin que los usuarios o administradores tengan que solicitarlo personalmente. Adicionalmente, AltaVista es respetuoso y “ecológico” con la Red: Scooter viaja de página en página procurando no sobrecargar ningún servidor con consultas repetidas. Además, los usuarios pueden añadir código HTML a sus páginas personales o de empresa para evitar que sean indexadas por el robot, en caso de que sean privadas. Scooter también actúa de forma inteligente: las páginas que cambian con mayor frecuencias (como las de noticias) son las más visitadas y actualizadas. También, automáticamente, las que no pueden ser visitadas de nuevo en días siguientes, son eliminadas para evitar enlaces que no lleven a ningún lugar.

Consejos generales

Lo primero que se debe hacer es leer y revisar con calma la Ayuda o el FAQ (Preguntas Frecuentes) en el buscador favorito, para adaptar estos consejos o comprobar si funcionan del mismo modo en unos que en otros. Leer las instrucciones del buscador durante unos minutos ahorrará horas de búsquedas infructuosas y permitirá aprender nuevos trucos.

 Usar minúsculas y evitar las tildes, al menos al principio. Esto aumenta las posibilidades de encontrar una o varias palabras, dado que la mayor parte de los buscadores son sensibles a mayúsculas/minúsculas sólo si se emplean letras en mayúsculas, o a las tildes sólo si se escriben las palabras con tilde. Es decir: “leon” dará por válidas palabras como “leon”, “león”, “León” y “LEON”, mientras que “León” hace que deba aparecer la palabra exactamente así, en mayúsculas y acentuada.

 Buscar pistas y seguir los enlaces. Aunque una búsqueda parezca difícil porque lo que aparece no es profesional ni completo, como las páginas personales de muchos usuarios, no se deben perder los enlaces encontrados; es conveniente guardarlos, por si se requiere una revisión exhaustiva. En muchas ocasiones, un pequeño enlace en una página personal puede dar palabras o términos interesantes sobre los que continuar la búsqueda, especialmente cuando se trata de páginas en otros idiomas.

 Utilizar primero los buscadores en español. Si lo que se busca, está disponible en castellano, se debe comenzar por ahí, aunque la probabilidad sea pequeña.

 Buscar la información también en inglés. Si no se encuentra en castellano, se continúan las búsquedas en inglés; pero se necesitará conocer no sólo la traducción exacta de las palabras, sino su significado en el contexto de la información

 Vigilar la ortografía, porque muchas veces una búsqueda infructuosa se debe a errores de ortografía que pasan desapercibidos. Se recomienda usar los contadores de aciertos, los de AltaVista indican cuántas veces aparece cada palabra en la búsqueda: si aparece ninguna o muy pocas veces tal vez sea que ha cometido algún error al escribir el término.

 Se recomienda ser genérico. Según la búsqueda, a veces conviene no usar nada más que las raíces de las palabras (“españ*” para España, por ejemplo) para poder encontrar expresiones similares (España, español, españolas), variaciones de la palabra en plural, género, tiempo de un verbo, etc.

 Ir al grano. Si se conoce cómo debe aparecer una expresión, se debe teclear encerrada entre comillas, con todas las palabras. Es mejor “Miguel de Cervantes” (si se busca al célebre escritor) o “física cuántica” que “miguel cerv*” (más genérica, pero que dará algunas sorpresas como páginas sobre Miguel que hablen de cerveza) o “+física +cuántica” (las palabras podrían aparecer no contiguas en el resultado).

 Leer el FAQ de un tema concreto; para ello se deben localizar los Documentos de Preguntas Frecuentes sobre el tema que se investiga, sean juegos, películas, ciencia o política. Hay muchos documentos de este tipo de Internet, mantenidos por voluntarios; por eso, aunque no se encuentre la respuesta al primer intento, posiblemente se hallarán enlaces interesantes.

 Optar por las páginas de calidad, ya que tienden a ser más completas y a estar desarrolladas por personas y grupos interesados en recopilar información cuidadosa y actualizada. Hay que estar atento a las “páginas oficiales sobre...” (también las “no-oficiales”, que muchas veces son incluso mejores), las páginas de “recursos sobre...” y similares. Los sitios Web bien diseñados tienen menos errores, cambian menos de sitio y, en general, son mejor referencia que las páginas personales o de aficionados, aunque siempre hay excepciones. Las páginas de calidad también son más mencionadas y mejor catalogadas por buscadores y páginas sobre temas similares.

 Buscar los enlaces directamente. En AltaVista, la expresión “link:www.paginaweb.es” permite encontrar todas las páginas Web que contengan enlaces a una página determinada. Es una forma rápida de encontrar sitios que apunten a una página interesante, y generalmente esos sitios tendrán información de temas similares.

 Si no se encuentra la respuesta, se debed preguntar; para ello, existen los grupos de Usenet en castellano, o los grupos internacionales. Buscar el más adecuado y realizar la pregunta. Se debe recordar que la Red existe porque los usuarios la han llenado de contenidos y enlazado en una formidable maraña de enlaces, y que todo usuario debería aportar su granito de arena.

3. Google



Google está diseñado para imponer orden en el caos de información. Es lo que debería ser un servicio de búsqueda; no un directorio editado y limitado o una lista de resultados que han sido otorgados al mejor postor, sino un método bien concebido de organización de Internet de acuerdo con su propia estructura. Google ha revolucionado la búsqueda en la Web con su tecnología de PageRankTM de patente pendiente. PageRank aprovecha la naturaleza estructural de la Web, lo que se define por el modo en que cada página Web puede vincularse con cualquier otra, de manera instantánea, directa y sin un intermediario. En cierto sentido, esta estructura de vínculo democratiza automáticamente Internet. Esto elimina la jerarquía y permite que la información y las ideas circulen sin obstáculos de un sitio a otro. Google es un Buscador con robot que indexa páginas en todo Internet, sin diferenciaciones. Actualmente, trabaja en los siguientes idiomas: Alemán, Chino (simplificado), Chino (tradicional), Coreano, Danés, Español, Finlandés, Francés, Holandés, Inglés Italiano, Japonés, Noruego, Portugués y Sueco. Absolutamente todas las temáticas son incluidas dentro de Google.com. y constituye la mayor base de datos existente. Su novedad estriba en prestar sus servicios de buscador a Yahoo y en actualizarse con mucha regularidad.

A diferencia de muchos otros motores de búsqueda, Google sólo produce resultados que corresponden a todos sus términos de búsqueda, ya sea en el texto de la página o en los delimitadores de vínculo que señalan la página. No más frustraciones con resultados que no tienen nada que ver con sus términos de búsqueda. En vez de resúmenes de páginas Web que nunca cambian, Google extrae el texto que coincide con la consulta y esta personalización ahorra el tiempo y la frustración de cargar una página Web inútil. Google almacena muchas páginas Web en su memoria caché con el fin de recuperarlas para los usuarios como una copia de seguridad, en caso de que el servidor de la página falle temporalmente. Si el servidor no está disponible, la memoria caché de Google puede ser una salvación, porque con frecuencia, puede ser mucho más rápido que el vínculo normal, aunque la información reciba puede estar menos actualizada. Para introducir una consulta en Google, sólo se escriben algunas palabras descriptivas y se presiona la tecla Entrar (o se hace clic en el botón Búsqueda en Google) para obtener su lista de resultados pertinentes. Cuando se desea restringir una búsqueda, sólo se deben incluir más términos. Si se desean resultados más exactos, Google busca las palabras exactas que han sido escritas en el cuadro de búsqueda.

Sugerencias de búsqueda avanzada

• Búsquedas de frases. Con Google, se pueden buscar frases agregando comillas; cuando las palabras están entre comillas dobles ("como esta") aparecerán juntas en todos los documentos devueltos. Las búsquedas de frases con comillas son útiles cuando se buscan expresiones famosas o nombres específicos. Ciertos caracteres sirven como conectores de frases. Google reconoce guiones, barras, puntos, signos igual y apóstrofes como conectores. Los conectores de frases funcionan como comillas; por ejemplo, mother-in-law se trata como una frase, aunque las tres palabras no estén entre comillas.

• Palabras vacías. Google ignora las palabras y caracteres comunes, conocidos como palabras vacías y automáticamente no considera términos como "http" y "com," al igual que ciertos dígitos únicos y letras únicas, porque estos términos rara vez ayudan a limitar una búsqueda y pueden disminuir significativamente la velocidad de ésta. Se usará el signo "+" para incluir palabras vacías en la búsqueda. Se debe incluir un espacio antes del signo "+", también se puede añadir el signo "+" en las búsquedas de frases.

• Cómo excluir palabras de su búsqueda. A veces es útil optar por excluir ciertas palabras o frases, cuando necesite todos los resultados pertinentes excepto los que contengan cierta palabra o frase. Google admite esta funcionalidad "negativa" con el signo menos ("-"); para ello, se usará el signo menos para excluir en forma determinada un término de la búsqueda. Se debe recordar la inclusión de un espacio antes del signo menos y Google ignorará todas las páginas que contengan esa palabra.

Consejos generales

 Reducir el tema y su descripción; extraer palabras clave y categorías.
 Comenzar con sitios Web conocidos, recomendados, especializados, o ya revisados.
 Dirigirse a portales profesionales que puedan tener directorios o colecciones por temas
 Usar los directorios de tema de los motores de búsqueda.
 Usar un motor de búsqueda e ingresar las palabras clave. Se debe ubicar una combinación de palabras clave para localizar la información necesaria.
 Revisar el número de opciones devueltas; si hay demasiados sitios Web, se agregarán más palabras claves y, si hay pocas opciones, se reducirán o borrarán algunas palabras clave, o se substituirán por otras palabras clave.
 Revisar las primeras páginas devueltas: si no son útiles, se revisarán las palabras clave para una mejor descripción
 Usar las opciones de búsqueda avanzadas en los motores de búsqueda: Las opciones de búsqueda incluyen
o Combinación de palabras clave, incluso cintas booleanas.
o Lugares donde se hallan las palabras clave; por ejemplo, en el titulo, primer párrafo, etc.
o Idiomas en los cuales investigar.
o Sitios con archivos de medios de comunicación (imágenes, videos, música/MP3, Actives, JAVA, etc.)
o Fecha de creación o actualización de sitios Web.
 Investigar en varios motores de búsqueda. Cada motor de búsqueda tiene una diferente base de datos de los sitios Web que investiga. Algunos motores “Meta-Buscadores” actualmente buscan otros motores de búsqueda; así que cuando un motor de búsqueda restituye pocos sitios Web, otro puede devolver muchos.  Fichar la búsqueda; no es bueno dejar para última hora. Además, se debe tomar nota de la fecha en que se identifica la página Web porque es un sitio que cambia con frecuencia.


FUENTE

Carrera, L y M. Vásquez. (2007). Técnicas en el Trabajo de Investigación. Caracas: Panapo.