Also known as NCBI Reference Sequence Database, NCBI Reference Sequence
The Reference Sequence (RefSeq) database is an open access, annotated and curated collection of publicly available nucleotide sequences (DNA, RNA) and their protein products. RefSeq was introduced in 2000. This database is built by National Center for Biotechnology Information (NCBI), and, unlike GenBank, provides only a single record for each natural biological molecule (i.e. DNA, RNA or protein) for major organisms ranging from viruses to bacteria to eukaryotes.
RefSeq is een vrij toegankelijke databank waarin geannoteerde nucleotidesequenties (van DNA, RNA) en bijbehorende eiwitproducten zijn geïndexeerd. De database wordt beheerd door National Center for Biotechnology Information. In tegenstelling tot is elk macromolecuul slechts één keer in de datase opgenomen: RefSeq is dus niet-redundant, waardoor het een relatief kleine zoekruimte heeft. RefSeq probeert voor elk modelorganisme een afzonderlijke opname te maken van het genomisch DNA, de RNA-transcripten en de eiwitten die uit die transcripten voortkomen. RefSeq beperkt zich tot belangrijke organismen waarvoor voldoende gegevens beschikbaar zijn. In 2019 waren dit er ongeveer 97 duizend. Bij GenBank worden van elk ingediend organisme de sequenties opgenomen: ongeveer 250 duizend verschillende organismen.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).