Introducción
Desde hace un par de meses, en mi tiempo libre, vengo trabajando en un proyecto personal llamado Noti, que consiste en un agregador de noticias. La idea es hacer un sitio donde agrupar todas las noticias que salen en los medios de prensa uruguayos. El sitio ya está funcionando en modo prueba en http://notiuy.com.
Hoy en día que vivimos en el mundo de los blogs, está claro que un agregador de noticias es algo super útil y necesario. Sin embargo, hasta ahora no he visto ninguno uruguayo (aun no existe Google News Uruguay :)) y entonces de allí surgió la idea de crear Noti.
El objetivo es nuclear todas las noticias de sitios uruguayos y publicarlas en una única página web, para luego brindar feeds y mails de notificaciones con las últimas noticias. De esta forma, cada usuario podrá suscribirse a las áreas que le interesen. El Noti tiene un conjunto fijo de áreas bien definidas (áreas principales) que a su vez estan compuestas por una o más secciones de distintos sitios de noticias. La asociación entre el área principal y las secciones particulares las realiza una única vez el administrador y luego queda disponible para todos los usuarios, que no tienen que preocuparse de agrupar las categorías particulares de cada sitio, lo cual es una tarea engorrosa.
Aqui va un ejemplo de dos áreas, para dejar claro el concepto:
- Area Economía contiene: El País/Economía, Observa/Análisis Económico, Espectador/Análisis financiero
- Area Entretenimiento contiene: El País/Espectáculos, Observa/Cine, Brecha/Cartelera
Funcionamiento
Para comenzar a utilizar Noti basta con ir a http://notiuy.com, crearse un usuario, y suscribirse a las áreas de interés. El contenido, tanto de los feeds como de la página web, se actualiza cada una hora. Los mails de notificación aun no estan disponibles pues el sitio que lo hostea actualmente no lo permite.El Noti soporta actualmente tres tipos de suscripciones:
- suscripciones a áreas principales (que contienen varias secciones de distintos medios)
- suscripciones a sitios enteros (para recibir todas las noticias de un sitio particular)
- suscripción a secciones particulares de algun sitio (llamadas Categorías)
Desarrollo
Teniendo conocimiento de python, agregar otros sitios es muy sencillo, basta con bajar la página del sitio, entenderla, y escribir un parser que la procese y devuelva los datos masticados al Noti. En estos días, cuando me haga un tiempo entre los parciales de facultad y el trabajo, me voy a dedicar a agregarle mas sitios e implementar alguna característica nueva como las suscripciones por palabras clave, o sea, poder seleccionar una (o varias) palabras (p.ej: "linux" o "excavaciones") para recibir automáticamente todas las noticias uruguayas que salen con esas palabras. Otra característica muy útil a agregar es la búsqueda de noticias viejas, ya que actualmente solo muestras las del día.Como ven, aun queda mucha cosa por hacer, que se irá haciendo de a poco, en la medida que la respuesta a esta iniciativa sea positiva y tenga movimiento.
Este cuanto al Noti como proyecto de software, está liberado bajo licencia GPL y alojado en Sourceforge (ver su página aquí). El núcleo y la interfaz web de Noti estan escritos en php (orientado a objetos), y los buscadores (crawlers) están escritos en python. La comunicación entre los buscadores y el núcleo se realiza via XML sobre HTTP. Por más información sobre la arquitectura y otros datos técnicos pueden visitar la página de Noti en Sourceforge. De más está decir que si a alguien le interesa colaborar, no dude en ponerse en contacto y bienvenido sea!. Como ya dije, hay mucha cosa para hacer y, cuantos más seamos, mejor.
Bueno, eso es todo por ahora. Los mantendré informados sobre actualizaciones del sitio notiuy.com. Mientras tanto me gustaria oir opiniones sobre la idea, implementación y algun proyecto similar que ande en la vuelta, si es que saben de alguno.