feat: #37 Visualise diff stops #76

lsorba · 2025-09-14T20:58:15Z

Closes #37

Première version : prend un à trois geoJSON provenant de différentes sources, utilise le centroïde ou le médioïde pour afficher une carte avec les différences entre les arrêts.

A terme utiliser geoParquet lorsque les données seront disponibles.

…th clustering and mapping features. Updated process.mermaid.

…nation of medoid vs centroid.

…t data, add agency handling, and expand cluster details.

…f-stops # Conflicts: # uv.lock

lsorba · 2025-10-09T08:53:10Z

@NicolasGrosjean la version de pydantic n'est pas gelé, il est passé à la version 2.12 ce qui fait que les tests OSM ne passent plus car le message d'erreur testé contient la version For further information visit https://errors.pydantic.dev/2.11/v/int_parsing

…o be independent of pydantic's version.

lsorba · 2025-10-09T09:13:45Z

@NicolasGrosjean la version de pydantic n'est pas gelé, il est passé à la version 2.12 ce qui fait que les tests OSM ne passent plus car le message d'erreur testé contient la version For further information visit https://errors.pydantic.dev/2.11/v/int_parsing

J'ai fait une adaptation, je te laisse regarder.

…not set in parquet (OSM), enhance `stop_id` normalisation.

NicolasGrosjean · 2025-10-09T16:20:43Z

@NicolasGrosjean la version de pydantic n'est pas gelé, il est passé à la version 2.12 ce qui fait que les tests OSM ne passent plus car le message d'erreur testé contient la version For further information visit https://errors.pydantic.dev/2.11/v/int_parsing

J'ai fait une adaptation, je te laisse regarder.

Effectivement en copiant le message complet je n'avais pas vu que ça contenait la version, merci beaucoup pour le correctif.

NicolasGrosjean · 2025-10-09T16:32:14Z

pyproject.toml

    "pandas-stubs==2.3.0.250703",
    "pyarrow>=20.0.0",
    "pydantic>=2.11.9,<3.0.0",
+    "scikit-learn>=1.7.2",


Pour chaque package en version N.X.X, ça peut être intéressant d'ajouter un <N+1.0.0 afin d'éviter de se automatiquement mettre à jour sur une nouvelle version majeure qui pourra casser le code.

NicolasGrosjean · 2025-10-09T17:19:29Z

src/notebooks/2025-09-10_lsorba_visualise_stops_diff.ipynb

+   "metadata": {},
+   "source": [
+    "# Set the input GeoJSONs (can be 1 to 3 sources), can be also geoParquet files\n",
+    "a_path = Path(\"../data/transportdatagouv/stops_38.parquet\")\n",


Le nom du fichier a changé on dirait.

NicolasGrosjean · 2025-10-09T17:54:25Z

src/notebooks/2025-09-10_lsorba_visualise_stops_diff.ipynb

+    "    ]\n",
+    "]\n",
+    "\n",
+    "m = plot_clusters_interactive(out_nb, title=\"Stops diff clusters (coloured by presence)\")\n",


Je serai d'avis de mettre le plot dans une autre cellule pour découpler la construction du dataset et de la visualisation (notamment pour ne pouvoir relancer que le traitement dont on a besoin en cas de changements)

NicolasGrosjean

J'ai fini par exécuter le notebook et ai vu sur la carte avec des outliers bien loin de la France ...

Par contre ma machine s'est mise à swapper car l'exécution du notebook m'a pris plus de 7.5Go !

Est-ce que c'est possible de filtrer géographiquement les données avant d'afficher la carte ?

pyproject.toml

lsorba · 2025-10-10T14:11:53Z

J'ai fini par exécuter le notebook et ai vu sur la carte avec des outliers bien loin de la France ...

Par contre ma machine s'est mise à swapper car l'exécution du notebook m'a pris plus de 7.5Go !

Est-ce que c'est possible de filtrer géographiquement les données avant d'afficher la carte ?

Tu as du prendre le parquet 'all' essaie stops_38.parquet. Dans mon autre PR, j'ai normalisé les noms des fichiers.

J'en profite pour dire que bus_stops_isere.parquet n'a pas de CRS défini, je dois le forcer

    if not gdf.crs:
        # OSM data has no CRS defined, so we assume it's WGS84
        gdf.set_crs(EPSG_WGS84, inplace=True)

Le PR est en draft, j'attends de finir #85 pour le mettre en fusionnable, mais merci pour la revue :)

…oject.toml` and `uv.lock`.

…and `uv.lock`.

NicolasGrosjean · 2025-10-10T15:55:36Z

Tu as du prendre le parquet 'all' essaie stops_38.parquet. Dans mon autre PR, j'ai normalisé les noms des fichiers.

Effectivement j'ai pris 2025-09-08_stops_all.parquet une fois que j'ai fini de mettre en place git-lfs pour le récupérer.

J'en profite pour dire que bus_stops_isere.parquet n'a pas de CRS défini, je dois le forcer

Merci , je vais appliquer ce code dans le pipeline

Le PR est en draft, j'attends de finir #85 pour le mettre en fusionnable, mais merci pour la revue :)

Désolé j'ai fait la review suite à l'email de demande de review, je n'avais pas fait attention que tu avais enlevé la demande 😊

lsorba self-assigned this Sep 14, 2025

lsorba added 3 commits September 25, 2025 09:54

Add first version of the notebook for visualising stop differences wi…

e33600e

…th clustering and mapping features. Updated process.mermaid.

Improve clustering configuration (tolerance, medoid usage). Add expla…

b46b7fb

…nation of medoid vs centroid.

Enhance stop differences notebook: support GeoParquet, normalise inpu…

c7ead6b

…t data, add agency handling, and expand cluster details.

lsorba force-pushed the feat-37-visualise-diff-stops branch from 355de09 to c7ead6b Compare September 25, 2025 09:54

lsorba added 2 commits October 9, 2025 10:31

Merge remote-tracking branch 'origin/main' into feat-37-visualise-dif…

8337ce1

…f-stops # Conflicts: # uv.lock

Update dependencies in pyproject.toml and uv.lock.

1778a84

Update test assertions to use startswith for log message matching t…

6f9027c

…o be independent of pydantic's version.

lsorba marked this pull request as ready for review October 9, 2025 09:13

lsorba requested review from NicolasGrosjean and RiwsPy and removed request for NicolasGrosjean and RiwsPy October 9, 2025 09:14

lsorba marked this pull request as draft October 9, 2025 09:30

lsorba added 2 commits October 9, 2025 12:08

Refine stop differences notebook: improve CRS handling: force CRS if …

0f89b10

…not set in parquet (OSM), enhance `stop_id` normalisation.

Cleaned notebook

1311c48

NicolasGrosjean reviewed Oct 9, 2025

View reviewed changes

NicolasGrosjean requested changes Oct 9, 2025

View reviewed changes

NicolasGrosjean reviewed Oct 9, 2025

View reviewed changes

pyproject.toml Outdated Show resolved Hide resolved

pyproject.toml Outdated Show resolved Hide resolved

lsorba added 2 commits October 10, 2025 16:14

Remove unused dependencies: affine and contextily. Clean up `pypr…

ffe598c

…oject.toml` and `uv.lock`.

Pin scikit-learn dependency to version 1.7.* in pyproject.toml …

e06623a

…and `uv.lock`.

Refine stop differences notebook: improve code and comments

e6cb256

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

feat: #37 Visualise diff stops #76

feat: #37 Visualise diff stops #76

Uh oh!

lsorba commented Sep 14, 2025

Uh oh!

lsorba commented Oct 9, 2025

Uh oh!

lsorba commented Oct 9, 2025

Uh oh!

NicolasGrosjean commented Oct 9, 2025

Uh oh!

NicolasGrosjean Oct 9, 2025 •

edited

Loading

Uh oh!

NicolasGrosjean Oct 9, 2025

Uh oh!

NicolasGrosjean Oct 9, 2025

Uh oh!

NicolasGrosjean left a comment

Uh oh!

Uh oh!

Uh oh!

lsorba commented Oct 10, 2025

Uh oh!

NicolasGrosjean commented Oct 10, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

feat: #37 Visualise diff stops #76

Are you sure you want to change the base?

feat: #37 Visualise diff stops #76

Uh oh!

Conversation

lsorba commented Sep 14, 2025

Uh oh!

lsorba commented Oct 9, 2025

Uh oh!

lsorba commented Oct 9, 2025

Uh oh!

NicolasGrosjean commented Oct 9, 2025

Uh oh!

NicolasGrosjean Oct 9, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

NicolasGrosjean Oct 9, 2025

Choose a reason for hiding this comment

Uh oh!

NicolasGrosjean Oct 9, 2025

Choose a reason for hiding this comment

Uh oh!

NicolasGrosjean left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

lsorba commented Oct 10, 2025

Uh oh!

NicolasGrosjean commented Oct 10, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

NicolasGrosjean Oct 9, 2025 •

edited

Loading