martes, 24 de septiembre de 2013

Search engines design

Image: MoneyBlogNewz/Flickr (Creative Commons)

Existen, hoy en día, decenas de motores de búsqueda a lo largo de Internet. Todos ellos reúnen una gran cantidad de conocimientos en todas las áreas de la informática y la matemática. Actualmente, diseñar un motor de búsqueda para contenidos globales en Internet implica unas técnicas muy avanzadas sobre teoría del lenguaje, matemáticas, IA, sistemas distribuidos, redes, bases de datos y programación. 

Uno de los buscadores más avanzados es el conocido motor Google, con varios CPDs (Centro de Procesamiento de Datos) situados en diferentes países. Este alarde tecnológico precisa de ubicaciones en las latitudes más frías del planeta y un gasto energético considerable. Por este motivo necesitan de una política tecnológica de ahorro y optimización de procesos y recursos. 

Para programar sus servicios de búsqueda, Google utiliza generalmente C++, Java y Python, pero según el artículo de Wikipedia actualmente se decantan por el lenguaje "open-source" Go. Obviamente, los conocimientos avanzados de CORBA, Sockets y RMI son también fundamentales en este tipo de disciplinas informáticas. 

La historia de los buscadores en Internet comienza en 1993 con el primer motor "Wandex" desarrollado en el MIT. Posteriormente surgieron otros como "Lycos" y "WebCrawler" en el 1994. Como es lógico, se está empezando a escribir el futuro de la búsqueda de información en Internet, y lo que ahora se ha diseñado es solo una ínfima parte de lo que depararán los próximos años. 

En nuestra Universidad, el departamento de Lenguajes y Sistemas Informáticos tiene una larga trayectoria investigadora y un reconocido grupo de investigadores (premiados por Google Inc.) en el campo del procesamiento del lenguaje natural y recuperación de la información, a través del grupo NLP (Natural Language Processing). 

Uno de los productos resultado de las investigaciones del departamento es el buscador JBraindead: un buscador fuera de lo común que como característica novedosa opta por una aproximación basada en retículos en lugar de jerarquías, lo que facilita la representación de relaciones complejas que impliquen, por ejemplo, herencia múltiple.

Por último, si su interés es el estudio o investigación de los motores de búsqueda, le proponemos las siguientes lecturas y tutoriales:

No hay comentarios:

Publicar un comentario en la entrada