Politica de uso, acceso y embargo de datosde la iniciativa 1000 Genomas Chile
La Iniciativa 1000 Genomas Chile (1000GCh) tiene por objetivo secuenciar 1000 genomas de especies eucariontes nativas de Chile. El proyecto sigue los estándares de calidad definidos por el Earth BioGenome Project (EBP) para la secuenciación de genomas de referencia, con el fin de obtener en lo posible un genoma ensamblado a nivel cromosómico y de telómero a telómero (telomere-2-telomere (T2T) assemblies).
1000GCh se reserva el derecho de realizar análisis globales sobre los genomas obtenidos y de publicar los resultados en la literatura científica. Asímismo, se compromete a compartir los datos generados de manera oportuna y con la menor cantidad de restricciones posible, promoviendo el avance del descubrimiento científico y maximizando el valor de este conjunto de datos para la comunidad.
Política de uso y acceso a los datos.
El acceso a los datos generados por 1000GCh se realizará en dos etapas:
1. Etapa de acceso limitado.
Durante esta etapa el acceso a los datos estará restrinigodo a los miembros de 1000GCh que participan en el estudio de una especie o grupo de especies en particular. Tendrán el derecho a la primera presentación quienes produjeron los datos, los proveedores de muestras y los colaboradores. La primera presentación se refiere exclusivamente a publicaciones en revistas científicas revisadas por pares (peer-review publications) y preprints, como los publicados en bioRxiv. Esta presentación puede incluir análisis a nivel genómico, incluyendo estudios filogenéticos, señales de selección, introgresión y otros análisis evolutivos. Todas las personas con derecho a la primera presentación son libres de publicar, y liberar el genoma para su uso sin restricciones una vez que los datos hayan sido publicados en alguna revista científica o como preprint en plataformas como bioRxiv.
2. Etapa de acceso abierto.
Una vez finalizado el periodo de embargo o tras la aceptación de la publicación principal, los datos estarán disponibles públicamente a través de alguna de las organizaciones miembros del International Nucleotide Sequence Database Collaboration (INSDC). En algunos casos especiales, los datos brutos de secuenciación de un genoma podrían estar disponibles de forma anticipada si así lo requieren las bases de los fondos que financiaron dicho genoma. En estos casos, se deberá respetar el derecho de 1000GCh a la primera presentación, como productores de los datos.
Fomento del intercambio de datos y colaboración.
1000GCh promueve el intercambio de datos y la colaboración científica para avanzar en el descubrimiento científico y maximizar el valor de este conjunto de datos para la comunidad. Durante la primera etapa de acceso limitado, si bien el acceso estará restringido a los investigadores asociados a 1000GCh, se invita a que otros investigadores a utilizar los datos obtenidos, siempre que se respete el derecho de 1000GCh a la primera presentación. Para solicitar acceso a los datos, se debe contactar a Pamela Morales (pmorales@1000genomas.cl), Data Manager de 1000 Genomas, proporcionando:
- Nombre de quien solicita el acceso
- Afiliación de quien solicita el acceso.
- Un breve resumen del próposito y uso que se hará de los datos.
La solicitud será evaluada por los Coordinadores de 1000GCh, y en caso de aprobación, se otorgará el acceso apropiado a los datos. Es esencial destacar que la información compartida es confidencial entre las partes involucradas y no debe ser compartida ni divulgada con terceros antes de su publicación, ya sea en forma de producción científica o como datos depositados en repositorios públicos. En este contexto, se entiende por confidencialidad la distribución o el intercambio no autorizado con terceros por parte de los socios del proyecto.
Para aquellos que no son responsables de producir o patrocinar los datos, se contemplan excepciones a la política del período de embargo en los siguientes casos:
- Análisis de un solo locus o una sola familia de genes entre especies
- Análisis de hasta de 5 loci o familias de genes dentro de una especie
- Uso del genoma obtenido por 1000GCh como referencia para mapear lecturas de estudios independientes. En este caso, la publicación de los resultados deberá esperar hasta la publicación del genoma por quien posea el derecho a la primera presentación o hasta que termine el período de embargo.
Se considera usuarios de los datos a todas las personas que hagan uso de los datos crudos o procesados generados por 1000GCh. Esto incluye a:
- Investigadores principales
- Colaboradores (incluidos los miembros del Comité de Selección de Especies del mismo grupo taxonómico)
- Estudiantes en formación
- Cualquier otro miembro aprobado por la coordinadora general de 1000GCh, Dra. Juliana Vianna, en conjunto con los coordinadores de los comités de Selección de Especies y Colecta de Muestras, Secuenciación e Infraestructura de Secuenciación, y Bioinformática e infraestructura Computacional de 1000GCh.
Las responsabilidades de los usuarios de los datos son:
- Solicitar autorización para acceder a los datos.
- Utilizar y proteger la información conforme a las condiciones establecidas, incluyendo la política de uso de los datos descrita en este documento.
- Reconocer el proyecto 1000GCh en los agradecimientos de cualquier publicación que resulte del uso de estos datos.
Período de embargo.
El período de embargo será de:
- Tres años desde la fecha de liberación de los datos crudos de secuenciación del genoma.
- Dos años desde la fecha de liberación del ensamble del genoma anotado en algunas de las organizaciones miembros del INSDC, o desde la publicación del genoma por parte de 1000 Genomas Chile, lo que ocurra primero.
El estado del embargo, así como su duración o ausencia, se especificará en la página de descripción del BioProject para cada genoma. Cuando el embargo se levante debido a una publicación, el ensamble del genoma se actualizará para incluir la cita de la publicación. En todos los casos, tanto antes como después de la liberación de los datos, los estudios que utilicen estos genomas deberán citar a las personas o publicaciones relevantes responsables del genoma.
Sobre los datos compartidos.
1000GCh promueve que los datos generados sean compartidos de la manera más amplia y efectiva posible, teniendo en cuenta las siguientes consideraciones:
- Accesibilidad: Los datos primarios y los ensambles finales deben ser depositados en repositorios de acceso público. Los números de acceso de los conjuntos de datos deben incluirse en todas las publicaciones.
- Reconocimiento de quienes proveen los datos: Los investigadores que contribuyen a la generación y análisis de los datos deben ser debidamente reconocidos en las publicaciones y otros productos derivados.
Todos los miembros de 1000GCh tendrán acceso anticipado a los genomas generados por y/o para 1000GCh antes de su publicación. Se alienta a todos los miembros de 1000GCh a participar colaborativamente en los análisis, siempre que sea posible.
Los datos no publicados de los genomas contribuidos por miembros de 1000GCh no podrán ser utilizados para publicaciones dentro del período de embargo por otros miembros de 1000GCh sin el permiso de la dirección responsable de esos genomas.
Los miembros de 1000GCh que trabajen en proyectos que utilizan las mismas especies dentro de 1000GCh deben informar a la Coordinadora Nacional, Dra. Juliana Vianna, para minimizar posibles conflictos de interés y evitar la sobreposición de los objetivos.
El Proyecto 1000 Genomas busca optimizar los esfuerzos en la secuenciación al asegurar que las mismas especies no sean secuenciados varias veces. Para ello, la información sobre las especies de interés de 1000 Genomas se encuentra disponible en la plataforma GoaT. Además, a nivel nacional, mantenemos contacto con diversas iniciativas dedicadas a la secuenciación de especies chilenas, lo que nos permite llevar un registro adecuado y así evitar la duplicación de esfuerzos.
Data usage, access, and embargo policy of the 1000 genomes chile initiative
The 1000 Genomes Chile Initiative (1000GCh) aims to sequence 1,000 genomes of native eukaryotic species from Chile. The project follows the quality standards defined by the Earth BioGenome Project (EBP) for reference genome sequencing to obtain, whenever possible, a chromosome-level and telomere-to-telomere (T2T) assembled genome.
1000GCh reserves the right to conduct global analyses on the obtained genomes and publish the results in the scientific literature. Likewise, it is committed to sharing the generated data promptly and with as few restrictions as possible, fostering scientific discovery and maximising the value of this dataset for the community.
Data Usage and Access Policy.
Access to data generated by 1000GCh will occur in two stages:
1. Limited Access Stage.
During this stage, data access will be restricted to 1000GCh members involved in studying a specific species or group of species. The data producers, sample providers, and collaborators have the right to the first presentation. The first presentation refers exclusively to publications in peer-reviewed scientific journals and preprints, such as those published in bioRxiv. This presentation may include genome-level analyses, including phylogenetic studies, selection signals, introgression, and other evolutionary analyses. All individuals with the right to the first presentation can publish and release the genome for unrestricted use once the data have been published in a scientific journal or as a preprint on platforms like bioRxiv.
2. Open Access Stage.
After the embargo period has ended or the main publication has been accepted, the data will be publicly available through one of the International Nucleotide Sequence Database Collaboration (INSDC) member organisations. In certain exceptional cases, raw genome sequencing data may be made available earlier if required by the funding terms for that genome. In these cases, the right to the first presentation of 1000GCh as the data producer must be respected.
Promotion of Data Sharing and Collaboration.
1000GCh promotes data sharing and scientific collaboration to advance discovery and maximise the value of this dataset for the community.
While access will be restricted to researchers associated with 1000GCh during the Limited Access Stage, other researchers are invited to use the obtained data, provided that the right to the first presentation of 1000GCh is respected.
To request access to the data, please contact Pamela Morales (pmorales@1000genomas.cl), Data Manager of 1000 Genomes, providing the following information:
- Full name of the requester.
- Institutional affiliation.
- A summary of the intended use of the data.
The request will be evaluated by the 1000GCh Coordinators, and if approved, appropriate access to the data will be granted.
It is essential to emphasise that the information shared between the involved parties is confidential and must not be shared or disclosed to third parties before its publication, whether as a scientific production or as data deposited in public repositories. In this context, confidentiality refers to the unauthorised distribution or exchange of data with third parties by project partners.
For those who are not responsible for producing or sponsoring the data, exceptions to the embargo policy apply in the following cases:
- Analysis of a single locus or a single gene family across species
- Analysis of up to 5 loci or gene families within a species
- Use of the genome obtained by 1000GCh as a reference for mapping reads from independent studies. In this case, the publication of results must wait until the genome is published by the first presentation rights holder or until the embargo period ends.
Data Users.
Data users include all individuals utilising raw or processed data generated by 1000GCh. This includes:
- Principal investigators.
- Collaborators (including members of the Species Selection Committee for the same taxonomic group)
- Students in training.
- Any other member approved by the General Coordinator of 1000GCh, Dr. Juliana Vianna, in coordination with the Species Selection and Sample Collection Committee, Sequencing and Sequencing Infrastructure Committee and Bioinformatics and Computational Infrastructure Committee.
The responsibilities of data users are:
- Request authorisation to access the data.
- Use and protect the information following the established conditions, including the data usage policy outlined in this document.
- Acknowledge the 1000GCh project in the acknowledgements of any publication resulting from the use of these data.
Período de embargo.
The embargo period will be:
- Three years from the release date of the raw genome sequencing data.
- Two years from the release date of the annotated genome assembly in one of the INSDC member organisations or from the genome publication by 1000GCh, whichever occurs first.
The BioProject description page for each genome will specify the embargo’s status, duration, or absence.
Once the embargo is lifted due to publication, the genome assembly will be updated to include the publication citation.
Studies using these genomes must cite the relevant persons or publications responsible for the genome in all cases, before and after data release.
On the Shared Data.
1000GCh promotes the broadest and most effective sharing of generated data, considering the following aspects:
- Accessibility: Primary data and final genome assemblies must be deposited in publicly accessible repositories. Accession numbers for the datasets must be included in all publications.
- Recognition of data contributors: Researchers contributing to data generation and analysis must be acknowledged appropriately in publications and other derived outputs.
All 1000GCh members will have early access to the genomes generated by and/or for 1000GCh before publication. Members are encouraged to participate collaboratively in analyses whenever possible.
Unpublished genome data contributed by 1000GCh members cannot be used for publications within the embargo period by other 1000GCh members without the permission of the responsible genome director.
1000GCh members working on projects involving the same species as those within 1000GCh must inform the National Coordinator, Dr Juliana Vianna, to help minimise conflicts of interest and avoid overlapping objectives.
The 1000 Genomes Project seeks to optimise sequencing efforts by ensuring that the same species is not sequenced multiple times. To achieve this, information on 1000GCh’s species of interest is available on the GoaT platform. Additionally, at the national level, we maintain contact with various initiatives conducting genome sequencing of Chilean species, allowing us to keep proper records and prevent duplicate efforts.