Qu'est-ce qu'un catalogue ?
Un catalogue est le résultat d’un processus d'organisation et de classification des ressources, telles que des livres, des documents, des données, des images, des vidéos.
Le catalogue est créé par l’attribution de métadonnées aux ressources. Les métadonnées sont toutes les informations qui décrivent les ressources. Par exemple, les métadonnées peuvent être constituées des informations suivantes : l’auteur, le producteur, l’identifiant, la version, la date de création, la date de mise à jour, la date de publication, le format, le lieu de stockage, la langue, la généalogie, les sources, la licence...
Le catalogue permet une recherche efficace car la métadonnée permet de rechercher et de filtrer les ressources en fonction de différents critères. Le contenu recherché est ainsi plus pertinent car le contenu est plus compréhensible grâce aux données de contextualisation.
Il existe des normes de métadonnées selon le type de ressource. L’utilisation des normes permet de constituer des catalogues homogènes, sans oubli d’information essentielle. Mais surtout, la norme permet l’interopérabilité des catalogues. Ceux-ci peuvent être « appelés » dans des services de recherche. Par exemple, les outils de gestion bibliographique permettent aux chercheurs du monde entier de se connecter facilement à de nombreux catalogues.
L’interopérabilité, c’est aussi la possibilité pour les catalogues de moissonner d’autres catalogues. Les catalogues se connectent entre eux et échangent les métadonnées et les ressources. Un ré-utilisateur peut ainsi consulter une multitude de catalogues à partir d’un seul site de recherche. Et le producteur de données ne catalogue ses données qu’à un seul endroit. On augmente la découvrabilité des données.
Un utilisateur recherchant des données sur un territoire faiblement étendu ira rechercher dans le catalogue local le plus proche. En revanche un utilisateur d’un autre pays ira plus facilement consulter DataNormandie, la région étant plus connue à l’international. Ces deux utilisateurs trouveront tous les deux la même ressource, qui aura été déposée à un seul endroit par le producteur de donnée.
Chercher un jeu de données dans DataNormandie
DataNormandie héberge et moissonne des
données publiques ouvertes de différents types : base de données, tableurs, datavisualisations, cartes, tableaux de bords, études. Il s’agit de
données publiées par les structures publiques ou privées ayant une mission de service public relevant du
livre III du code des relations entre le public et l’administration (le lien s'ouvre dans un nouvel onglet) (accès aux documents administratif et la réutilisation des informations publiques).
Pour
rechercher des données dans DataNormandie, vous pouvez accéder au catalogue directement depuis la page d’accueil, ou en cliquant sur le bouton ci-dessus
« accès au catalogue » .
Notez un premier mot-clé dans le moteur de recherche ou cliquez sur la loupe. Si vous cliquez sur la loupe, l’ensemble des données s’affiche.
Un bandeau vertical sur la gauche vous permet de
« filtrer votre recherche selon certains critères » (type de données, organisation ayant publié les données, mots-clés, thèmes, zone géographique). Nous vous conseillons de procéder en plusieurs étapes et ne pas mettre trop de critères lors de votre première étape de recherche. Vous pourrez affiner au fur et à mesure et retirer des filtres
(« effacer les filtres » ) si les critères sont trop sélectifs.
Les jeux de données apparaissent selon vos critères de sélection. Vous pouvez observer dès ce niveau que les jeux de données proposent différentes représentations pré-établies et modalités d'utilisation : tableau, carte, analyse, documents, export, API.
Cliquez sur le jeu de données recherché.
Chaque jeu de données est présenté dans un cadre comprenant différents onglets : informations, tableau, carte, analyse, exploitations, export, API, réutilisations.
Pour exploiter les données par la suite, dans les datavisualisations, les cartes et les tableau de bord, vous aurez besoin d'avoir sélectionné vos données dans le panier.
- information : Ce premier onglet vous renseigne sur le contenu du jeu de données : Qui l'a produit ? Comment la donnée a été produite ? Quelle encodage ? Quelle fréquence de mise à jour ? Quelles limites d'usage ? etc
- tableau : Cet aperçu des données vous donne des indications complémentaires pour vous représenter mentalement la donnée. Vous pouvez filtrer les données sur certaines colonnes, puis les partager immédiatement, les intégrer dans un site sous forme d'iframe ou les enregistrer sous forme de widget. Vous pouvez les ajouter dans un panier. Donnez un nom au panier.
- carte : La visualisation des données géographiques sous forme de carte vous permet d'utiliser un autre mode de sélection par emprise géographique. Là aussi, vous pouvez les partager immédiatement, les intégrer dans un site sous forme d'iframe ou les enregistrer sous forme de widget ou les ajouter dans un panier (vous pouvez avoir plusieurs paniers).
- analyse: Cet onglet contient un outil de visualisation. Choisissez les données que vous souhaitez mettre en valeur et enregistrez votre datavisualisation. Vous pouvez effectuer plusieurs datavisualisations, toutes auront leur lien de partage, leur widget, leur iframe et la possibilité de les conserver dans un panier.
- exploitations: ce sont des exploitations proposées par la structure qui a déposé la donnée sur DataNormandie.
- export : Différents formats d'export vous sont proposés. La licence du jeu de données est mentionnée.
- API : Vous pouvez utiliser les données via une API-rest. Une API-rest est un programme informatique qui va chercher les données dans un système pour les mettre dans un autre système. Concernant le jeu de données que vous souhaiter utiliser, DataNormandie génère les lignes de code de l'API. Vous n'avez plus qu'à copier ces lignes et les coller dans votre système. L'API est une fonctionnalité très pratique lorsque les données évoluent fréquemment. Les données intégrées dans votre système sont automatiquement mises à jour sans intervention de votre part.
- réutilisations : Cet onglet vous permet de proposer des réutilisations, afin qu'elles apparaissent dans le catalogue des réutilisations de DataNormandie.
Stocker ses recherches dans un panier
Pour élaborer vos tableaux de bord facilement, vous aurez besoin d'un panier rempli de données, datavisualisations, cartes.
Pour accéder à ses paniers ; on peut en avoir plusieurs ; il faut
être connecté avec ses identifiants.
Vous remplissez votre panier en sélectionnant des jeux de données. Dans les onglets Tableau, Carte, Analyses, vous pouvez soit télécharger les jeux de données, leur visualisation telle quelle ou opérer vos propres analyses et ajouter ces analyses au panier.
Dans l'interface des paniers, vous pouvez :
- modifier le titre du panier
- créer le rapport du panier
- télécharger le panier entier
- supprimer le panier
- rendre le panier public
- télécharger uniquement certains éléments
- retirer des éléments
Chercher des données dans OpenStreetMap
OpenStreetMap (OSM) est une base de données géographiques ouverte qui permet à quiconque de contribuer et d'accéder à des informations géographiques. Les données sont très riches sur certains territoires et de nombreuses collectivités les intègrent dans leur système d'information. Elles participent à la dynamique en ouvrant leur propres données en open data ou en contribuant directement à la constitution de la base de données. Les données OSM sont disponibles sous licence ODBL.
Avant d'extraire les données d'OSM, il faut se pencher sur la manière dont la donnée est collectée et notamment connaître les tags (éléments cartographiques), ainsi que les tags les plus utilisés (Taginfo).
1. Des outils clés en main
Planète OSM est le site de téléchargement des données OSM, mais la base étant très grande, vous trouverez des sites vous permettant de faire des extractions sur des zones plus petites.
GeoDataMine est un assistant très simple qui permet de télécharger très simplement une trentaine de jeux de données OSM sur des périmètres administratifs dans différents formats.
/br>
Vous pouvez télécharger les données de régions entières depuis le site comme Geofabrik. La base de données OSM est découpée par région.
Vous pouvez télécharger des données depuis BBBike (contrairement à ce que le nom laisse penser ce n’est pas un site de téléchargement des données vélo) dans différents formats.
Le site HOT (Humanitaire OpenStreetMap) a créé un service qui permet d’extraire des données OSM en sélectionnant secteur géographique, caractéristiques cartographiques et format de fichiers.
2. Téléchargez exactement la donnée que vous cherchez avec Overpass Turbo.
Overpass Turbo offre un assistant de requêtes des données OSM.
accédez à Overpass Turbo
zoomez sur la carte pour sélectionner un secteur de recherche
cliquez sur le bouton « Assistant » et entrez une requête (pour la première fois, testez par exemple amenity=drinking_water ).
exécutez la Requête : Cliquez sur le bouton « Construire et exécuter la requête » pour exécuter la requête. Les résultats seront affichés sur la carte.
téléchargez les résultats : Vous pouvez télécharger les résultats dans différents formats en cliquant sur « Exportateur »
3. QGIS
QGIS est un système d'information géographique (SIG) open-source qui permet de visualiser, éditer et analyser des données géographiques. Vous pouvez importer des données OSM dans QGIS pour les analyser et les visualiser. Téléchargez le « plug-in QuickOSM » pour visualiser les données et opérer les analyses spatiales souhaitées.
Les licences
Les licences sont des contrats qui permettent d'organiser les conditions dans lesquelles un personne va pouvoir accéder, réutiliser et diffuser le contenu placé sous cette licence. Il est donc important de connaitre la licence des données que vous utilisez.
La plupart des données que vous utilisez sur DataNormandie sont en
Licence Ouverte version 2.0 (le lien s’ouvre dans un nouvel onglet) ou en
Open Database License (OdbL) version 1.0 (le lien s’ouvre dans un nouvel onglet). En effet, elles sont diffusées par les structures publiques ou privées ayant une mission de service public et sont soumises à ce titre au code des relations entre le public et l'administration qui impose les licences suivantes.
Licences utilisées par les administrations Article D323-2-1 du code des relations entre le public et les administrations (le lien s’ouvre dans un nouvel onglet).
|
Bases de données |
Codes sources |
Tout autre type de données |
Licences permissives |
Licence Ouverte 2.0 |
Berkeley Software Distribution License, Apache, CeCILL-B, Massachusetts Institute of technology License |
Licence ouverte 2.0 |
Licences avec obligation de réciprocité |
OdBL |
Mozilla Public license, General Public Licence (GNU), CeCILL, European Union Public Licenses, Eclipse Public License |
Détail des licences sur
la page dédiée aux licences sur le site data.gouv.fr (le lien s’ouvre dans un nouvel onglet)
Vous vous posez des questions sur le droit des données ? Nous vous recommandons de consulter le site
GreenData4Health (le lien s'ouvre dans un nouvel onglet) qui a réalisé des
fiches synthétiques (le lien s'ouvre dans un nouvel onglet) sur un grand nombre de questions juridiques liées à la donnée.