-
Notifications
You must be signed in to change notification settings - Fork 8
feat: #37 Visualise diff stops #76
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
base: main
Are you sure you want to change the base?
feat: #37 Visualise diff stops #76
Conversation
…th clustering and mapping features. Updated process.mermaid.
…nation of medoid vs centroid.
…t data, add agency handling, and expand cluster details.
355de09 to
c7ead6b
Compare
…f-stops # Conflicts: # uv.lock
|
@NicolasGrosjean la version de pydantic n'est pas gelé, il est passé à la version 2.12 ce qui fait que les tests OSM ne passent plus car le message d'erreur testé contient la version |
…o be independent of pydantic's version.
J'ai fait une adaptation, je te laisse regarder. |
…not set in parquet (OSM), enhance `stop_id` normalisation.
Effectivement en copiant le message complet je n'avais pas vu que ça contenait la version, merci beaucoup pour le correctif. |
pyproject.toml
Outdated
| "pandas-stubs==2.3.0.250703", | ||
| "pyarrow>=20.0.0", | ||
| "pydantic>=2.11.9,<3.0.0", | ||
| "scikit-learn>=1.7.2", |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Pour chaque package en version N.X.X, ça peut être intéressant d'ajouter un <N+1.0.0 afin d'éviter de se automatiquement mettre à jour sur une nouvelle version majeure qui pourra casser le code.
| "metadata": {}, | ||
| "source": [ | ||
| "# Set the input GeoJSONs (can be 1 to 3 sources), can be also geoParquet files\n", | ||
| "a_path = Path(\"../data/transportdatagouv/stops_38.parquet\")\n", |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Le nom du fichier a changé on dirait.
| " ]\n", | ||
| "]\n", | ||
| "\n", | ||
| "m = plot_clusters_interactive(out_nb, title=\"Stops diff clusters (coloured by presence)\")\n", |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Je serai d'avis de mettre le plot dans une autre cellule pour découpler la construction du dataset et de la visualisation (notamment pour ne pouvoir relancer que le traitement dont on a besoin en cas de changements)
NicolasGrosjean
left a comment
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
J'ai fini par exécuter le notebook et ai vu sur la carte avec des outliers bien loin de la France ...
Par contre ma machine s'est mise à swapper car l'exécution du notebook m'a pris plus de 7.5Go !
Est-ce que c'est possible de filtrer géographiquement les données avant d'afficher la carte ?
Tu as du prendre le parquet 'all' essaie
J'en profite pour dire que Le PR est en draft, j'attends de finir #85 pour le mettre en fusionnable, mais merci pour la revue :) |
…oject.toml` and `uv.lock`.
Effectivement j'ai pris
Merci , je vais appliquer ce code dans le pipeline
Désolé j'ai fait la review suite à l'email de demande de review, je n'avais pas fait attention que tu avais enlevé la demande 😊 |

Closes #37
Première version : prend un à trois geoJSON provenant de différentes sources, utilise le centroïde ou le médioïde pour afficher une carte avec les différences entre les arrêts.
A terme utiliser geoParquet lorsque les données seront disponibles.