Európai Bioinformatikai Intézet
Európai Bioinformatikai Intézet (EBI) | |
Alapítva | 1992[1] |
Székhely | Wellcome Genome Campus, Hinxton , Cambridgeshire, UK |
Igazgató | Ewan Birney |
Dolgozók száma | 570[2] |
Elhelyezkedése | |
é. sz. 52° 04′ 48″, k. h. 0° 11′ 11″52.079889°N 0.186356°EKoordináták: é. sz. 52° 04′ 48″, k. h. 0° 11′ 11″52.079889°N 0.186356°E | |
Az Európai Bioinformatikai Intézet (EBI) weboldala |
Az Európai Bioinformatikai Intézet (EMBL-EBI) az Európai Molekuláris Biológiai Laboratórium (EMBL) részeként bioinformatikai kutatásokra és szolgáltatásokra összpontosító kormányközi szervezet (IGO). A Cambridge melletti Hinxtonban lévő Wellcome Genome Campusban van a székhelye, és több mint 600 teljes munkaidős dolgozója van.[3] Az intézet vezetői, például Rolf Apweiler, Alex Bateman, Ewan Birney és Guy Cochrane, a Nemzeti Genomikai Adatközpont Tudományos Tanácsadó Testületének részeként a Pekingi Genomikai Intézet BIG Adatközpontjának nemzetközi kutatóhálózatában dolgoznak.[4]
Ezenkívül az EMBL-EBI tréningeket is szervez a biológiai adatokkal való munka alapjainak és a kutatáshoz használható bioinformatikai EMBL-EBI- és nem EMBL-EBI-alapú eszközök alkalmazásának megtanításához is.
Bioinformatikai szolgáltatások
[szerkesztés]Az EMBL-EBI fontos szerepe több adatbázisban is a biológiai adatok indexelése és kezelése, beleértve a teljes genomok adatait tartalmazó Ensemblt, a fehérjeszekvenciákat és -jelöléseket tartalmazó UniProtot és a fehérje- és nukleinsavharmadlagosszerkezet-adatbázis Protein Data Banket. Számos internetes szolgáltatást és eszközt biztosít, például a Basic Local Alignment Search Toolt (BLAST) vagy a Clustal Omega szekvenciarendező eszközt, további elemzést lehetővé téve.
BLAST
[szerkesztés]A BLAST[5] biomakromolekulák elsődleges szerkezetét, gyakran DNS/RNS- és fehérjeszekvenciákat hasonlítja össze, melyek a bioinformatikai adatbázisokban találhatók a lekérdezett szekvenciával. Az algoritmus az elérhető szekvenciákat értékeli értékelő mátrixszal, például BLOSUM 62-vel. A legmagasabb értékelést kapó szekvenciák a lekérdezett legközelebbi rokonai funkciós és evolúciós hasonlóság terén.[6]
A BLAST általi adatbázis-keresés megfelelő formátumú (például FASTA, GenBank, PIR vagy EMBL) adatot igényel. Kijelölhetők a keresni kívánt adatbázisok, a használni kívánt értékelő mátrixok és más paraméterek a futtatás előtt. A legjobb találatokat a számított E-érték (a hasonlóan vagy jobban értékelt találatok valószínűsége) szerint rendezi.[7]
Clustal Omega
[szerkesztés]A Clustal Omega[8] többszekvenciás elrendezéses (MSA) eszköz, mely lehetővé teszi legalább 3, legfeljebb 4000 bevitt DNS- és fehérjeszakasz optimális elrendezését.[9] Ez kétprofilú rejtett Markov-modelleket (HMM) használ a szekvenciák elrendezésének számításához. A kimenet faszerkezetben (a legjobban összeillő szekvenciák filogenetikai kapcsolataival) vagy a lekérdezések szekvenciahasonlósága szerint is rendezhető.[10] Fő előnye más MSA-eszközökkel (például a Muscle-lel vagy a ProbConszal) szemben a nagy pontosság melletti hatékonysága.
Ensembl
[szerkesztés]Az EMBL-EBI által üzemeltetett Ensembl[11] az Ensembl Projekt által fenntartott genomadatbázis. A modellszervezetek genomjainak folytonos jelölésével az Ensembl az egyes genomokról jelentős forrást biztosít. A tárolt referenciagenomok jelölése automatikus és szekvenciaalapú. Az Ensembl nyilvánosan, böngészőből elérhető genomadatbázis. A tárolt adat grafikusan megtekinthető és vizsgálható, segítve az adatmegjelenítést több felbontásban – kariotípus, egyes gének vagy nukleotidszekvencia szintjén.[12]
Eredetileg gerincesekre összpontosított, 2009-től azonban az Ensembl Genomesban növények, gombák, gerinctelenek, baktériumok és más fajok genomjait is tartalmazza. 2020-ban az egyes Ensembl-adatbázisok több mint 50 000 referenciagenomot tartalmaztak.[13]
PDB
[szerkesztés]A PDB[14] biológiai makromolekulák, például fehérjék és nukleinsavak háromdimenziós szerkezeteinek adatbázisa. Ezt elsősorban röntgenkrisztallográfia vagy NMR-spektroszkópia útján kapják, és szerkezeti biológusok küldik a PDB tagszervezetein (PDBe, RCSB, PDBj, BMRB) át. Az adatbázis a tagok, így az EMBL-EBI által fenntartott PDBe weblapján hozzéférhető. A wwPDB konzorcium tagjaként a PDBe segíti a makromolekulák szerkezeti adatainak megőrzését és fenntartását.[15]
UniProt
[szerkesztés]A UniProt a UniProt Tudásbázisban (UniProt-KB), a UniProt Referenciacsoportokban (UniRef) és a UniProt Archívumban (UniParc) hozzáférhető internetes fehérjeszekvencia- és -jelölés-adatbázis. Eredetileg az EMBL-EBI, a Svájci Bioinformatikai Intézet (SIB) (együtt működtették a Swiss-Protot és a TrEMBL-t) és a Protein Sequence Database-t működtető Protein Information Resource önálló projektjei voltak, a fehérjeadatok keletkezésének gyorsulása együttműködésükhöz vezetett a UniProtban 2002-ben.[16]
A UniProtban tárolt fehérjerekordok önálló UniProt-azonosítóval rendelkeznek. Az ezekhez gyűjtött adatok logikai szakaszokban (például fehérjefunkció, szerkezet, expresszió, szekvencia, releváns publikációk) vannak, lehetővé téve a koordinált áttekintést a vizsgált fehérjéről. A külső adatbázisok hivatkozásai és az eredeti adatforrások is megtalálhatók. A fehérjenév/azonosító szerinti keresés mellett a UniProt a BLAST-tal való kereséshez, a szekvenciaelrendezéshez és bizonyos szakaszokat tartalmazó fehérjék kereséséhez is tartalmaz eszközöket.[17]
További bioinformatikai szervezetek
[szerkesztés]- Biotechnológiai Információk Nemzeti Központja (NCBI), United States National Library of Medicine
- Nemzeti Genetikai Intézet (DNA Data Bank of Japan)
- Svájci Bioinformatikai Intézet (SIB: Expasy)
- Ausztrál Bioinformatikai Forrás
- BIG Adatközpont (Nemzeti Genomikai Adatközpont), Pekingi Genomikai Intézet, Kínai Tudományos Akadémia
Jegyzetek
[szerkesztés]- ↑ Background | European Bioinformatics Institute. Ebi.ac.uk, 2018. május 16. (Hozzáférés: 2019. október 29.)
- ↑ Jobs at EMBL-EBI. (Hozzáférés: 2016. június 20.)
- ↑ Scientific report. www.embl.de , 2017. (Hozzáférés: 2019. október 29.)
- ↑ Annual Report. BIG Adatközpont, Pekingi Genomikai Intézet, Kínai Tudományos Akadémia, 2018. (Hozzáférés: 2020. március 26.)
- ↑ NCBI BLAST at EMBL-EBI. www.ebi.ac.uk . (Hozzáférés: 2021. november 3.)
- ↑ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990. október 1.). „Basic local alignment search tool”. Journal of Molecular Biology 215 (3), 403–410. o. DOI:10.1016/S0022-2836(05)80360-2. PMID 2231712.
- ↑ Wheeler D, Bhagwat M. BLAST QuickStart, Methods in Molecular Biology (angol nyelven). Humana Press, 149–176. o. (2007. december 8.)
- ↑ Clustal Omega at EMBL-EBI. ebi.ac.uk . (Hozzáférés: 2021. november 3.)
- ↑ Clustal Omega Documentation at EMBL-EBI. ebi.ac.uk . (Hozzáférés: 2021. november 3.)
- ↑ Sievers F, Higgins DG (2018. január 1.). „Clustal Omega for making accurate alignments of many protein sequences”. Protein Science 27 (1), 135–145. o. DOI:10.1002/pro.3290. PMID 28884485. PMC 5734385.
- ↑ Ensembl homepage. ensembl.org . (Hozzáférés: 2021. november 3.)
- ↑ Howe KL, Achuthan P, Allen J, Allen J, Alvarez-Jarreta J, Amode MR, Armean IM, Azov AG, Bennett R, Bhai J, Billis K, Boddu S, Charkhchi M, Cummins C, Da Rin Fioretto L, Davidson C, Dodiya K, El Houdaigui B, Fatima R, Gall A, Garcia Giron C, Grego T, Guijarro-Clarke C, Haggerty L, Hemrom A, Hourlier T, Izuogu OG, Juettemann T, Kaikala V, Kay M, Lavidas I, Le T, Lemos D, Gonzalez Martinez J, Marugán JC, Maurel T, McMahon AC, Mohanan S, Moore B, Muffato M, Oheh DN, Paraschas D, Parker A, Parton A, Prosovetskaia I, Sakthivel MP, Salam AI, Schmitt BM, Schuilenburg H, Sheppard D, Steed E, Szpak M, Szuba M, Taylor K, Thormann A, Threadgold G, Walts B, Winterbottom A, Chakiachvili M, Chaubal A, De Silva N, Flint B, Frankish A, Hunt SE, IIsley GR, Langridge N, Loveland JE, Martin FJ, Mudge JM, Morales J, Perry E, Ruffier M, Tate J, Thybert D, Trevanion SJ, Cunningham F, Yates AD, Zerbino DR, Flicek P (2021. január 1.). „Ensembl 2021”. Nucleic Acids Research 49 (D1), D884–D891. o. DOI:10.1093/nar/gkaa942. PMID 33137190. PMC 7778975.
- ↑ About the Ensembl Project. ensembl.org . (Hozzáférés: 2021. november 3.)
- ↑ Burley, Stephen K. (2019. január 1.). „Protein Data Bank: the single global archive for 3D macromolecular structure data”. Nucleic Acids Research 47 (D1), D520–D528. o. DOI:10.1093/nar/gky949. PMID 30357364. PMC 6324056.
- ↑ About PDBe. ebi.ac.uk . (Hozzáférés: 2021. november 3.)
- ↑ About UniProt. uniprot.org . (Hozzáférés: 2021. november 3.)
- ↑ Bateman, Alex (2021. január 1.). „UniProt: the universal protein knowledgebase in 2021”. Nucleic Acids Research 49 (D1), D480–D489. o. DOI:10.1093/nar/gkaa1100. PMID 33237286. PMC 7778908.
Fordítás
[szerkesztés]Ez a szócikk részben vagy egészben az European Bioinformatics Institute című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.