Au cours de l’expédition Tara-Oceans (2009-2012), dans laquelle nous pouvons aussi inclure Tara-Oceans Polar Circle (2013), plus de 33000 échantillons ont été récoltés. Alors que certaines analyses ont été initiées à bord de Tara, la vaste majorité des échantillons a été directement rapatriée vers les différents laboratoires impliqués en vue d’une analyse ultérieure. L’imagerie et le séquençage haut-débit mis en place dans les groupes de travail 3 et 4 génèrent des quantités énormes de données, estimées à ce jour à environ 500 To de données brutes, qui nécessitent d’être archivées de manière consciencieuse et liées aux données physico-chimiques associées à chaque station de prélèvement des échantillons correspondants.
Les objectifs de ce groupe de travail sont les suivants :
Ce groupe de travail est coordonné par Ian Probert à la Station Biologique de Roscoff et il fait intervenir l’UMR7144 et la FR2424 de la Station Biologique de Roscoff, le laboratoire océanologique de Villefranche sur Mer, l’IGS de Marseille, l’EMBL, et Altran. En tant que partenaires collaboratifs, le VIB et Pangaea sont aussi impliqués.
Les échantillons collectés au cours de l’expédition Tara-Océans ont été étiquetés à l’aide d’un système de code-barres et répartis, pour la plupart, entre les laboratoires français impliqués (Station Biologique de Roscoff, Génoscope et IBENS), mais aussi ailleurs en Europe et aux Etats-Unis. Afin de pallier à un manque crucial de suivi des échantillons (localisation et utilisation), OCEANOMICS a pour objectif de créer un système qui permet leur gestion.
La tâche consiste à définir précisément:
C’est en basant sur les résultats de cette réflexion que le système de gestion est développé et mis en place à la Station Biologique de Roscoff. Après une phase de test en interne, l’interface développée sera proposée à l’ensemble des partenaires et une procédure d’évaluation sera mise en place afin d’assurer une évolution optimale de l’outil.
L'objectif de la tâche est de produire un entrepôt de données intégré avec un point d'entrée unique pour accéder à toutes les données primaires découlant de l’expédition Tara-Océans production des groupes de travail n°2, 3 et 4) ainsi qu’aux analyses de modélisation produites par le groupe de travail n°5. Dans la plupart des cas, les données resteront archivées à l’endroit où elles ont été produites et l’outil développé dans cette tâche permettra d’y accéder par le biais de requêtes avancées. Une interface web permettra à l’utilisateur de naviguer dans cet entrepôt de données et d’interroger son contenu.
Indissociable de la tâche décrite précédemment, le travail effectué dans ce cadre apportera à l’utilisateur des outils de visualisation et d’analyse des données regroupées dans l’entrepôt afin de disposer de ces données primaires, mais aussi de données secondaires et d’analyses écosystémiques qui en découlent. La force du jeu de données Tara-Océans/OCEANOMICS réside dans son homogénéité, son interdisciplinarité et dans les différents niveaux systémiques concernés : des recoupements de données seront possibles concernant différents paramètres tels que les données satellites, les séquences de gènes, les données d’imagerie (des virus au zooplancton) et plusieurs types de paramètres biophysiques, physiques et chimiques pour une unique colonne d’eau.
Des modules de comparaison et d’analyse seront développés à plusieurs niveaux systémiques :