Résumé: Les réseaux ferroviaires sont des systèmes très instables : il suffit parfois d'un petit incident pour paralyser toute une ligne pendant plusieurs heures. Ces phénomènes de propagation sont dus à des conflits de ressources entre trains, c'est pourquoi leur compréhension nécessiterait des données très précises sur le plan de transport. Malheureusement, de telles données sont souvent inaccessibles.
Nous proposons donc un nouveau modèle de retards basé sur une variable latente qui représente la congestion des voies. Cette congestion vit sur les arêtes du graphe qui représente le réseau, et elle évolue suivant un processus auto-régressif vectoriel (VAR) en grande dimension. Cependant, pas question de l'observer directement : les seules informations dont on dispose sont les temps de trajet des trains, ce qui correspond à une projection bruitée du signal d'intérêt. Dans ces conditions, apprendre la matrice de transition du processus VAR peut se révéler difficile.
Nos analyses statistiques fournissent le taux de convergence optimal de l'erreur d'estimation, qui dépend de plusieurs paramètres facilement interprétables : dimension du réseau, densité du trafic, vitesse de propagation des retards. Nous prouvons d'abord l'existence d'une borne inférieure minimax, qui s'applique à n'importe quel estimateur, puis nous identifions un algorithme parcimonieux capable d'atteindre cette borne inférieure.