1- Nécessités d’un référencement et nature du référencement effectué :


1.1- Pourquoi est-il nécessaire de contrôler la géolocalisation des données issues des campagnes de biogéochimie ?

Tout océanographe sait qu’il faut consigner l’heure et la position d’une donnée. Le problème n’est pas là. Dans la pratique, à bord d’un bateau, on dispose de plusieurs heures (heure locale, heure TU différents affichages), de plusieurs positions (navigation intégrée, plusieurs GPS). Quelle heure notée, celui du début de la station, du prélèvement ?. Chacun à des exigences particulières. De plus les affichages ne sont pas toujours à jour et les erreurs de transcription ou d’acquisition sont fréquentes. Il est donc indispensable au niveau de la validation de définir une heure officielle et une position officielle cohérente. Si ce n’est pas fait dans une base de fichier, croiser des données ayant des géolocalisations de précision différentes n‘est pas toujours chose aisée. Tel prélèvement a-t-il été effectué sur la même bouteille que tel autre ? La réponse à cette question pertinente n’est pas chose aisée sans validation. Heureusement la contrainte généralement imposée par le chef de mission est de toujours noter le numéro de station et le numéro de bouteille. Il est donc nécessaire de transcrire ces références en géolocalisation par rapport à une heure et position officielle.

1.2- Géolocalisation validée et harmonisée : Les chercheurs qui ont fourni des données au site web Pomme, ont souvent localisé leur données, mais la présentation de cette localisation n’était donc pas imposée ni la précision. Leur localisation doit donc être contrôlée et, en cas d’absence totale ou partielle), précisée. La géolocalisation complète minimale adoptée est :

- date et heure TU (jour julien 2001, jour 1 à 0h00 = 1.00000) du prélèvement pour les continus de surface ou du début du profil CTD pour les données rosette

- position géographique en Latitude et Longitude en format degrés et fraction de degré (5 chiffres décimaux)

- Pour les données acquises en station :

- le n° de station (ex : 2010 pour la station 10 de Pomme 2)

- le n° de la bouteille de prélèvement utilisée

- la profondeur officielle en déci bars pour les données issues de la rosette de bouteilles de prélèvement.

Le n° de station et le n° de bouteille a servi de base de référencement pour les données de prélèvement (rosette) ; ce repérage était la seule contrainte a priori imposée, en référence au principe de contrainte minimale. Inévitablement des exceptions ont été trouvées et elles ont été consignées dans les rapports journaliers joints à tout fichier validé.


Toujours pour les données en station, les choix suivants ont été pris :


1.3- Le référencement est un complément explicite d’information des fichiers individuels. Pour respecter le principe de tracabilité, le référencement officiel est juxtaposé, et placé dans les premières colonnes du fichier référencé, aux données de dosage ou de sondes même dans le cas où une géolocalisation partielle ou complète était présente dans les fichiers originaux. Dans ce cas également deux localisations sont donc trouvées dans le fichier, mais une seule est officielle. Aucune comparaison systématique n’a été effectuée sur la correspondance entre ces deux localisations, l’objet d’une telle comparaison n’étant pas pertinent.


1.4- Le travail de référencement a été effectué par leg. Le résultat est donc un fichier par leg pour chaque groupe de variables du site Pomme web et quel que soit le nombre de données effectives dans le fichier ; le nombre de ligne des fichiers pour un leg donné est le même pour toutes les variables. Les fichiers des différents groupes de variables sont donc homogènes et comparables par concaténation directe des colonnes. Le nombre de ligne est défini par le nombre d’item constitué par l’assemblage nombre de station nombre de bouteilles déclenchées pour chaque station. Un tableau est joint en Annexe avec les exceptions non détaillées ici.