Also known as NCBI Reference Sequence Database, NCBI Reference Sequence
base de datos que contiene secuencias de referencia de genes, proteínas y transcripciones
RefSeq (de The Reference Sequence en Inglés) es la base de datos pública de secuencias de ácidos nucleicos (ADN y ARN) y proteínas, anotadas y curadas, del Centro Nacional para la Información Biotecnológica (NCBI). RefSeq comenzó a funcionar en el año 2000 y, a diferencia de GenBank, solo ofrece un registro por cada biomolécula, ya sea ADN, ARN o proteína, para los organismos más relevantes desde virus hasta bacterias y eucariotas. Para cada organismo modelo, RefSeq guarda registros separados y enlazados para el ADN genómico, los transcritos y las proteínas resultantes de estos. Esta base de datos está limitada a los organismos más importantes, para los que hay disponible la suficiente información (121 461 organismos diferentes a fecha de julio de 2022), mientras que GenBank incluye secuencias para cualquier organismo subido a la base de datos (aproximadamente 504 000 especies formalmente descritas).
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).