Diario Sarebus

El blog de sarebus.com

Tantos proveedores, tantos problemas: por qué montamos un admin propio

Tras definir el producto en mayo, pasar de un operador de prueba a decenas de GTFS distintos nos obligó a construir herramientas internas para corregir paradas, nombres y rutas que los datos en bruto no resuelven solos.

El reto de escalar datos

Los primeros meses fueron relativamente sencillos: un feed, un operador, pocas sorpresas. Cuando empezamos a ingestar La Unión, Alsa, Pesa, Lurraldebus, Navarra Interurbano y decenas de concesiones más, el problema cambió de escala.

Cada proveedor trae:

  • Nombres de parada distintos para el mismo sitio físico.
  • Estaciones intermodales modeladas de formas incompatibles.
  • Horarios duplicados, rotaciones nocturnas y agencias GTFS que no coinciden con la marca comercial.
  • Rutas que parecen iguales en el mapa pero no encajan al comparar origen y destino entre operadores.

Errores que no se arreglan solos

Un buscador público necesita StopPlaces canónicos: un Bilbao-Termibus, un aeropuerto de Loiu, una estación de Vitoria reconocible por el usuario. Los feeds crudos no garantizan eso.

Encontramos casos típicos:

  • La misma parada con tres etiquetas según el operador.
  • Paradas a 80 metros que deberían ser una sola selección en autocomplete.
  • City hubs que hay que mantener a mano cuando entra un carrier nuevo.
  • Viajes que solo existen si cruzas datos de dos proveedores con convenciones distintas.

Nuestro panel de administración

Por eso montamos euskabus-admin: un panel interno (separado de la web pública) para curar datos sin tocar SQL a mano.

Desde ahí podemos:

  • Unir y separar StopPlaces, ajustar coordenadas y tipos (parada, estación, aeropuerto).
  • Gestionar city hubs y sus miembros.
  • Ver en mapa paradas candidatas a unificar cuando dos operadores nombran distinto el mismo sitio.
  • Invalidar caché pública cuando corregimos algo que afecta a búsqueda o SEO.

No es glamuroso, pero es lo que hace que Sarebus sea usable con decenas de fuentes distintas. Hoy el catálogo público supera 140.000 viajes programados sobre miles de paradas — cifras que actualizamos en Sarebus Empresas.

Siguiente paso

Seguimos ampliando operadores y endureciendo validaciones en la ingesta nocturna. Cada carrier nuevo enseña un error distinto — y cada error corregido mejora miles de búsquedas. Si vuestra empresa publica GTFS o compite rutas con el mismo dolor de cabeza, escribidnos: construimos esto porque nos encontramos el problema nosotros mismos.

Últimos artículos