square

Ocean Gene Atlas, explorer des Big Data marines à l'aide d'un simple navigateur internet

Des chercheurs de l'Institut Méditerranéen d'Océanologie (Marseille) et de la Station Biologique de Roscoff ont développé un site web permettant d'interroger facilement les ressources génomiques publiées récemment par le consortium Tara Oceans.

L'accès libre à l'Ocean Gene Atlas se fait à partir du lien suivant:

http://tara-oceans.mio.osupytheas.fr/ocean-gene-atlas/

 

 

Des jeux de données gigantesques, des trésors pour l'écogénomique fonctionelle

Afin de comprendre les mécanismes par lesquels les gènes influencent les phénotypes observés dans la nature, les biologistes utilisent souvent des approches réductionnistes qui ciblent des gènes marqueurs spécifiques connus, ou supposés jouer un rôle dans des processus biologiques tels que les voies métaboliques ou les interactions biotiques ou abiotiques. Utiliser des hypothèses sur de tels gènes marqueur nécessite une analyse détaillée de données génomiques volumineuses dans le contexte environnemental qui leur est propre. Dans le but de fournir des interprétations intégrées, cette tâche nécessite une grande expertise dans la gestion de types de données hétérogènes (i.e données de séquençage, assemblage, gènes associés aux annotations taxonomique et fonctionnelles, variables environnementales).

 

Récemment, l'expédition Tara Oceans a réalisé un échantillonage holistique suivi d'une analyse approfondie des données "omics" du plancton, comprenant une diversité de tailles d'organismes allant des virus aux larves de poissons. Cette approche a été associée à l'étude de mesures biogeochimiques in situ qui apporte des informations contextuelles détaillées importante pour la compréhension de l'écologie des microbiomes marins

 

La première version de l'Ocean Gene Atlas (OGA) offre à ses utilisateurs la possibilité d'explorer les deux plus grands catalogues de gènes marins jamais publiés (tous deux produits par le consortium Tara Oceans) où sont représentés les trois lignées eucaryotes, procaryotes et virales. D'un simple clic, il est possible de visualiser les abondances et les localisations de séquences d'intérêt sur une carte du monde. Ces informations sont complétées par les distributions taxonomiques de ces séquences, asssociées aux caractériques environnementales (température, nutriments, etc..) mesurées lors de l'échantillonage.

 

Ocean Gene Atlas, explore marine Big Data with nothing but a web browser
Ocean Gene Atlas, explore marine Big Data with nothing but a web browser

 

Pas de compétences particulières nécessaires en informatique

Le OGA web server vise à faciliter et à élargir l'accès aux jeux de données de génomique marine enviroennementale qui croissent rapidement, en masquant l'intégration complexe et chronophage des sources de données hétérogènes derrière un formulaire web minimaliste et convivial. Permettre aux biologistes marins d'extraire de telles données – sans matériel informatique spécifique ni compétences en programmation - est essentiel pour générer des connaissances sur ces ressources précieuses mais encore sous-exploitées.

 

A suivre !

L'intégration de données dans l'OGA est conditonnée par la disponibilité de trois ressources de base : les catalogues de séquences de gènes, les estimations de l'abondance des gènes dans les échantillons biologiques et le contexte environnemental géolocalisé de ces mêmes échantillons. Le catalogue de collections de l'OGA sera mis à jour régulièrement, au fur et à mesure que d'autres ensembles de données de génomique seront publiquement diffusés (en provenance des travaux réalisés dans le cadre Tara Oceans mais également par d'autres projets sur les biomes marins). Les futurs développements prévoient également l'ajout de modules améliorant l'interprétation des résultats, notamment pour affiner l'analyse taxonomique en construisant des arbres phylogénétiques ainsi que des représentations graphiques supplémentaires des données environnementales.

 

Reference dans Nucleic Acids Research:

Emilie Villar, Thomas Vannier, Caroline Vernette, Magali Lescot, Miguelangel Cuenca, Aurélien Alexandre, Paul Bachelerie, Thomas Rosnet, Eric Pelletier, Shinichi Sunagawa, Pascal Hingamp. (2018) The Ocean Gene Atlas: exploring the biogeography of plankton genes online, Nucleic Acids Research, gky376, http://doi.org/10.1093/nar/gky376

 

Contacts:

  • Emilie Villar,  Sorbonne Universités, UPMC Université Paris 06, CNRS, Laboratoire Adaptation et Diversité en Milieu Marin UMR7144, Station Biologique de Roscoff, Roscoff, France, emilie.villar1[at]gmail.com
  • Pascal Hingamp, Aix Marseille Univ, Université de Toulon, CNRS, IRD, MIO UM 110, 13288, Marseille, France, pascal.hingamp[at]mio.osupytheas.fr, Tel: +33 4 86 09 06 66; Fax: +33 4 86 09 06 41