(Jatkossa tämän jutun kaltaiset bioinformatiikkaan liittyvät tekniset artikkelit löytyvät aiheen bio-info alta. Bio-aiheen alla julkaisen luontoon, ympäristöön tai yleisbiologiaan liittyvät jutut. Voit halutessasi lukea vain yhtä aihealuetta RSS-virtana.)
LSID on standardoitu URN (Uniform Resource Name) -protokolla (protocol, spesification, scheme), joka tarjoaa yksiselitteisen tavan erilaisten biologisten tietovarantojen (data resources) nimeämiseen ja tunnistamiseen. Jokaiselle nimettävälle kohteelle annetaan yksilöllinen nimi, jonka avulla sen voi tunnistaa sijainnista riippumatta. LSID-tunnisteen määrittelemä kohde on muuttumaton; muuttuessa sille määritellään uusi LSID-tunniste. Kohde voi olla esimerkiksi lajinimi, havaintotietue tai kokoelmayksilötietue.
LSID-protokolla määrittelee myös standarditavan datan löytämiseen (tästä lisää myöhemmin).
Jokainen LSID-tunniste koostuu viidestä osasta:
- verkkotunniste (Network Identifier (NID))
- nimeäjätahon nimi, tavallisesti juuritason DNS-nimi (root DNS name)
- nimeäjätahon valitsema nimiavaruus (namespace)
- yksilöllinen tunniste ko. nimiavaruudessa (object id)
- vapaaehtoinen versionumero (revision id).
Osia erottaa kaksoispiste. Esimerkki: urn:lsid:ncbi.nlm.nig.gov:GenBank:T48601:2 (entry GenBankissa, toinen versio).
LSID-tunnisteita voidaan käyttää esimerkiksi tunnistamaan ovatko eri lähteistä kootut tiedot samoja tai yksilöimään käytetyt tietolähteen yksiselitteisesti.