Agregador De Noticias Uruguayas

Introducción

Desde hace un par de meses, en mi tiempo libre, vengo trabajando en un proyecto personal llamado Noti, que consiste en un agregador de noticias. La idea es hacer un sitio donde agrupar todas las noticias que salen en los medios de prensa uruguayos. El sitio ya está funcionando en modo prueba en http://notiuy.com.

Hoy en día que vivimos en el mundo de los blogs, está claro que un agregador de noticias es algo super útil y necesario. Sin embargo, hasta ahora no he visto ninguno uruguayo (aun no existe Google News Uruguay :)) y entonces de allí surgió la idea de crear Noti.

El objetivo es nuclear todas las noticias de sitios uruguayos y publicarlas en una única página web, para luego brindar feeds y mails de notificaciones con las últimas noticias. De esta forma, cada usuario podrá suscribirse a las áreas que le interesen. El Noti tiene un conjunto fijo de áreas bien definidas (áreas principales) que a su vez estan compuestas por una o más secciones de distintos sitios de noticias. La asociación entre el área principal y las secciones particulares las realiza una única vez el administrador y luego queda disponible para todos los usuarios, que no tienen que preocuparse de agrupar las categorías particulares de cada sitio, lo cual es una tarea engorrosa.

Aqui va un ejemplo de dos áreas, para dejar claro el concepto:

  • Area Economía contiene: El País/Economía, Observa/Análisis Económico, Espectador/Análisis financiero
  • Area Entretenimiento contiene: El País/Espectáculos, Observa/Cine, Brecha/Cartelera
De esta forma podemos tener agrupadas las noticias relevantes de todos los medios en una única área global y asi poder ver todo lo importante en una sola página en lugar de perder el tiempo recorriendo varios sitios para encontrar la nota que nos interesa. Las áreas pueden tener varias categorías de un mismo sitio (si corresponde) o incluso ninguna (si el sitio no tiene ninguna sección de esa área), como de la misma forma puede existir una categoría irrelevante (Editorial de algun diario, por ejemplo) que no pertenezca a ningún área.

Funcionamiento

Para comenzar a utilizar Noti basta con ir a http://notiuy.com, crearse un usuario, y suscribirse a las áreas de interés. El contenido, tanto de los feeds como de la página web, se actualiza cada una hora. Los mails de notificación aun no estan disponibles pues el sitio que lo hostea actualmente no lo permite.

El Noti soporta actualmente tres tipos de suscripciones:

  • suscripciones a áreas principales (que contienen varias secciones de distintos medios)
  • suscripciones a sitios enteros (para recibir todas las noticias de un sitio particular)
  • suscripción a secciones particulares de algun sitio (llamadas Categorías)
Como les decía, el sitio notiuy.com ya está funcionando para los que quieran ir probando las suscripciones y los feeds. Actualmente tiene 3 sitios: observa.com.uy espectador.com y elpais.com.uy, pero en estos días iré agregando más.

Desarrollo

Teniendo conocimiento de python, agregar otros sitios es muy sencillo, basta con bajar la página del sitio, entenderla, y escribir un parser que la procese y devuelva los datos masticados al Noti. En estos días, cuando me haga un tiempo entre los parciales de facultad y el trabajo, me voy a dedicar a agregarle mas sitios e implementar alguna característica nueva como las suscripciones por palabras clave, o sea, poder seleccionar una (o varias) palabras (p.ej: "linux" o "excavaciones") para recibir automáticamente todas las noticias uruguayas que salen con esas palabras. Otra característica muy útil a agregar es la búsqueda de noticias viejas, ya que actualmente solo muestras las del día.

Como ven, aun queda mucha cosa por hacer, que se irá haciendo de a poco, en la medida que la respuesta a esta iniciativa sea positiva y tenga movimiento.

Este cuanto al Noti como proyecto de software, está liberado bajo licencia GPL y alojado en Sourceforge (ver su página aquí). El núcleo y la interfaz web de Noti estan escritos en php (orientado a objetos), y los buscadores (crawlers) están escritos en python. La comunicación entre los buscadores y el núcleo se realiza via XML sobre HTTP. Por más información sobre la arquitectura y otros datos técnicos pueden visitar la página de Noti en Sourceforge. De más está decir que si a alguien le interesa colaborar, no dude en ponerse en contacto y bienvenido sea!. Como ya dije, hay mucha cosa para hacer y, cuantos más seamos, mejor.

Bueno, eso es todo por ahora. Los mantendré informados sobre actualizaciones del sitio notiuy.com. Mientras tanto me gustaria oir opiniones sobre la idea, implementación y algun proyecto similar que ande en la vuelta, si es que saben de alguno.

12 responses

Muy bueno prh! Muy útil! A mi viejo ya le puse el link en la barra del Safari para que lo consulte todos los días :)


En lo que pueda ayudar estoy a las órdenes, este tipo de cosas me parece que son muy buenas!

A mí también me pareció excelente. ¿Cuántos sitios hay que ver para sacar las noticias del día? Thumbs up.

Es un excelente workaround a la insensatéz de los medios locales.
Es increíble que todavía Espectador.com no tenga RSS o que Observa, El País, etc cobren por las noticias.

Gracias por los comentarios positivos. Como bien dice Javier, es ridículo que los medios de prensa locales aun no provean feeds. Espero que Noti les sirva al menos como un tirón de orejas para implementarlos cuanto antes.


En cuanto a cobrar por las noticias, además de ser un problema que Noti no puede solucionar, me parece que la causa viene por el lado de que, aquí en Uruguay, la publicidad web como medio de recaudación nunca tuvo buen entrada. Prueba de ello fue el caso de Conectate (proveedor de acceso gratuito a Internet) hace un par de años.


De todas formas creo que el tema de la publicidad web fracasó hace unos años porque aun la infraestructura de servicios pagos por Internet aun no estaba lo suficientemente madura. Hoy en día, si bien la infraestructura no es tan sólida como la de países del primer mundo, estamos mejorando y cada vez hay más sitios uruguayos que venden por Internet. Creo que, a la larga, la publicidad web como medio primario de recaudación va a ser viable en el Uruguay, y será ahí cuando los diarios dejen de cobrar por las noticias. Otra cosa que podría ayudar también es la competencia, pero esa ya la veo más difícil.

Publicidad en internet como negocio en Uruguay? mmm... qué querés que te diga, el Uruguay es muy particular en materia de publicidad. La mayoría de la gente cree que es "jugar y cobrar", pero la verdad es que son muy pocos los medios rentables por una cuestión mercado: es un país muy chico. Pero quién sabe, capaz que me equivoco y en unos años las cosas son muy diferentes.

un diseñador gráfico urgente che!!


y un editor ya que las noticias son de pocas fuente y casi todas las mismas.

Las carencias de diseño son más que evidentes, ya que el objetivo inicial era tener algo funcional. Pero ya estamos trabajando en un rediseño del sitio junto con algunas otras sorpresas.


Lo del editor la veo difícil ya que la idea justamente es que el sistema se mantenga solo, sin intervención humana. Lo de las noticias duplicadas no lo veo tanto como un problema ya que te permite comparar los distintos enfoques dados a una misma noticia, por los diferentes medios.


Ya se agregaron dos sitios más: La República y Ultimas Noticias

Aviso también que ya está solucionado un problema que impedía registrar usuarios nuevos.

Aquí tenés algo similar y del que soy usuario desde hace años:
http://www.uruguaytotal.com/titulares/
Como no soy programador desconozco los métodos que utilizan para actualizarlo, pero siempre tiene lo último.


Estaba también el Ciade Digital que era un intento de acceder a noticias por sector de interés pagando una suscripción mensual, pero recién lo googlée un poco y me parece que desapareció. Siguen vendiendo todavía el Ciade impreso que yo recibo todos los días en la oficina.


Fuera de eso, me parece que la concentración de las noticias en un solo lugar es una idea brillante porque la repetición de las noticias entre canales, diarios y radios es tan cansador (somos un medio muy chico para generar cantidad) que se pierde mucho tiempo por día leyendo las mismas cosas en varios lados ... (no sé si me expliqué, pero bue...)
Felicitaciones por tu sitio !

Robak-tul, las noticias que estan en http://www.uruguaytotal.com/titulares/ son re-viejas y estan desactualizadas. Si eso alguna vez estuvo funcionando ya no lo está.

Fa ! Tenés razón, hacía tiempo que no pasaba por ahí y está super desactualizada. Una razón más para que te tires a realizar tu proyecto.
Salud

Simplemente ¡ ESPECTACULAR !
Felicitaciones y sigue adelante.