Wu Enhui, Qiao Liang*
Chemijos katedra, Fudano universitetas, Šanchajus 200433, Kinija
Mikroorganizmai yra glaudžiai susiję su žmonių ligomis ir sveikata. Kaip suprasti mikrobų bendruomenių sudėtį ir jų funkcijas, yra pagrindinis klausimas, kurį reikia skubiai ištirti. Pastaraisiais metais metaproteomika tapo svarbia technine priemone tiriant mikroorganizmų sudėtį ir funkcijas. Tačiau dėl mikrobų bendruomenės mėginių sudėtingumo ir didelio nevienalytiškumo mėginių apdorojimas, masės spektrometrijos duomenų gavimas ir duomenų analizė tapo trimis pagrindiniais iššūkiais, su kuriais šiuo metu susiduria metaproteomika. Atliekant metaproteomikos analizę, dažnai reikia optimizuoti išankstinį skirtingų tipų mėginių apdorojimą ir taikyti skirtingas mikrobų atskyrimo, sodrinimo, ekstrahavimo ir lizės schemas. Panašiai kaip ir vienos rūšies proteomas, masių spektrometrijos duomenų gavimo režimai metaproteomikoje apima nuo duomenų priklausomo gavimo (DDA) režimą ir nuo duomenų nepriklausomo gavimo (DIA) režimą. DIA duomenų gavimo režimas gali visiškai surinkti mėginio peptidinę informaciją ir turi didelį plėtros potencialą. Tačiau dėl metaproteomų mėginių sudėtingumo jo DIA duomenų analizė tapo pagrindine problema, trukdančia giliai aprėpti metaproteomiką. Kalbant apie duomenų analizę, svarbiausias žingsnis yra baltymų sekų duomenų bazės sukūrimas. Duomenų bazės dydis ir išsamumas turi ne tik didelę įtaką identifikacijų skaičiui, bet ir analizei rūšių bei funkciniais lygmenimis. Šiuo metu auksinis metaproteomų duomenų bazės kūrimo standartas yra baltymų sekų duomenų bazė, pagrįsta metagenomu. Tuo pačiu metu buvo įrodyta, kad viešųjų duomenų bazių filtravimo metodas, pagrįstas pasikartojančia paieška, turi didelę praktinę vertę. Konkrečių duomenų analizės strategijų požiūriu į peptidus orientuoti DIA duomenų analizės metodai buvo absoliuti pagrindinė dalis. Tobulėjant giluminiam mokymuisi ir dirbtiniam intelektui, tai labai padidins makroproteominių duomenų analizės tikslumą, aprėptį ir analizės greitį. Kalbant apie tolesnę bioinformatikos analizę, pastaraisiais metais buvo sukurta daugybė anotavimo priemonių, kurios gali atlikti rūšių anotaciją baltymų, peptidų ir genų lygiu, kad būtų galima gauti mikrobų bendruomenių sudėtį. Palyginti su kitais omikos metodais, mikrobų bendruomenių funkcinė analizė yra unikalus makroproteomikos bruožas. Makroproteomika tapo svarbia mikrobų bendruomenių daugiafunkcinės analizės dalimi ir vis dar turi didelį plėtros potencialą aprėpties gylio, aptikimo jautrumo ir duomenų analizės išsamumo požiūriu.
01 Mėginio išankstinis apdorojimas
Šiuo metu metaproteomikos technologija plačiai naudojama žmogaus mikrobiomo, dirvožemio, maisto, vandenyno, aktyvaus dumblo ir kitose srityse tyrimuose. Palyginti su vienos rūšies proteomų analize, sudėtingų mėginių metaproteomų mėginių apdorojimas susiduria su daugiau iššūkių. Mikrobų sudėtis faktiniuose mėginiuose yra sudėtinga, dinaminis gausos diapazonas yra didelis, skirtingų tipų mikroorganizmų ląstelių sienelių struktūra labai skiriasi, o mėginiuose dažnai yra daug baltymų šeimininkų ir kitų priemaišų. Todėl, analizuojant metaproteomą, dažnai reikia optimizuoti skirtingų tipų mėginius ir taikyti skirtingas mikrobų atskyrimo, sodrinimo, ekstrahavimo ir lizės schemas.
Mikrobų metaproteomų ekstrahavimas iš skirtingų mėginių turi tam tikrų panašumų ir tam tikrų skirtumų, tačiau šiuo metu trūksta vieningo išankstinio apdorojimo proceso skirtingų tipų metaproteomų mėginiams.
02 Masių spektrometrijos duomenų rinkimas
Atliekant šautuvo proteomų analizę, peptidų mišinys po išankstinio apdorojimo pirmiausia atskiriamas chromatografinėje kolonėlėje, o po to patenka į masės spektrometrą duomenims gauti po jonizacijos. Panašiai kaip ir vienos rūšies proteomų analizė, masių spektrometrijos duomenų gavimo režimai makroproteomų analizėje apima DDA režimą ir DIA režimą.
Nuolat kartojant ir atnaujinant masės spektrometrijos prietaisus, metaproteomui taikomi didesnio jautrumo ir skiriamosios gebos masės spektrometrijos instrumentai, taip pat nuolat tobulinamas metaproteomų analizės aprėpties gylis. Ilgą laiką didelės skiriamosios gebos masės spektrometrijos prietaisų serija, kuriai vadovauja Orbitrap, buvo plačiai naudojama metaproteome.
Pirminio teksto 1 lentelėje pateikiami keli reprezentatyvūs metaproteomikos tyrimai nuo 2011 m. iki dabar, atsižvelgiant į imties tipą, analizės strategiją, masės spektrometrijos prietaisą, gavimo metodą, analizės programinę įrangą ir identifikacijų skaičių.
03 Masių spektrometrijos duomenų analizė
3.1 DDA duomenų analizės strategija
3.1.1 Duomenų bazės paieška
3.1.2de novosekos nustatymo strategija
3.2 DIA duomenų analizės strategija
04Rūšių klasifikacija ir funkcinė anotacija
Mikrobų bendruomenių sudėtis skirtingais taksonominiais lygmenimis yra viena iš pagrindinių mikrobiomų tyrimų sričių. Pastaraisiais metais buvo sukurta daugybė anotavimo įrankių, skirtų rūšims komentuoti baltymų, peptidų ir genų lygiu, siekiant gauti mikrobų bendruomenių sudėtį.
Funkcinės anotacijos esmė – tikslinio baltymo sekos palyginimas su funkcinių baltymų sekų duomenų baze. Naudojant genų funkcijų duomenų bazes, tokias kaip GO, COG, KEGG, eggNOG ir kt., Makroproteomų identifikuotiems baltymams galima atlikti skirtingas funkcinių anotacijų analizes. Anotacijos įrankiai yra Blast2GO, DAVID, KOBAS ir kt.
05 Santrauka ir perspektyva
Mikroorganizmai vaidina svarbų vaidmenį žmonių sveikatai ir ligoms. Pastaraisiais metais metaproteomika tapo svarbia technine priemone tiriant mikrobų bendruomenių funkciją. Metaproteomikos analitinis procesas yra panašus į vienos rūšies proteomikos, tačiau dėl metaproteomikos tyrimo objekto sudėtingumo kiekviename analizės etape reikia priimti konkrečias tyrimo strategijas – nuo pirminio mėginio apdorojimo, duomenų gavimo iki duomenų analizės. Šiuo metu dėl pirminio apdorojimo metodų tobulinimo, nuolatinių masių spektrometrijos technologijų naujovių ir spartaus bioinformatikos vystymosi metaproteomika padarė didelę pažangą nustatant identifikavimo gylį ir taikymo sritį.
Atliekant išankstinį makroproteomų mėginių apdorojimą, pirmiausia reikia atsižvelgti į mėginio pobūdį. Kaip atskirti mikroorganizmus nuo aplinkos ląstelių ir baltymų yra vienas iš pagrindinių makroproteomų iššūkių, o atskyrimo efektyvumo ir mikrobų praradimo pusiausvyra yra neatidėliotina problema. Antra, ekstrahuojant mikroorganizmų baltymus, reikia atsižvelgti į skirtumus, atsirandančius dėl skirtingų bakterijų struktūrinio nevienalytiškumo. Makroproteomų mėginiams pėdsakų diapazone taip pat reikalingi specialūs išankstinio apdorojimo metodai.
Kalbant apie masių spektrometrijos prietaisus, įprasti masių spektrometrijos prietaisai buvo pakeisti nuo masių spektrometrų, pagrįstų Orbitrap masės analizatoriais, tokiais kaip LTQ-Orbitrap ir Q Exactive, prie masės spektrometrų, pagrįstų jonų mobilumo susietais skrydžio laiko masės analizatoriais, tokiais kaip timsTOF Pro. . timsTOF serijos instrumentai su jonų mobilumo matmenų informacija pasižymi dideliu aptikimo tikslumu, žema aptikimo riba ir geru pakartojamumu. Jie palaipsniui tapo svarbiais instrumentais įvairiose tyrimų srityse, kurioms reikalingas masės spektrometrinis aptikimas, pavyzdžiui, vienos rūšies proteomas, metaproteomas ir metabolizmas. Verta paminėti, kad ilgą laiką masių spektrometrijos prietaisų dinaminis diapazonas ribojo metaproteomų tyrimų baltymų aprėpties gylį. Ateityje masės spektrometrijos prietaisai, turintys didesnį dinaminį diapazoną, gali pagerinti baltymų identifikavimo metaproteomose jautrumą ir tikslumą.
Masės spektrometrijos duomenims rinkti, nors DIA duomenų gavimo režimas buvo plačiai naudojamas vienos rūšies proteomuose, dauguma dabartinių makroproteomų analizės vis dar naudoja DDA duomenų gavimo režimą. DIA duomenų gavimo režimas gali visiškai gauti mėginio fragmento jonų informaciją, o palyginti su DDA duomenų gavimo režimu, jis gali visiškai gauti makroproteomo mėginio peptidinę informaciją. Tačiau dėl didelio DIA duomenų sudėtingumo DIA makroproteomų duomenų analizė vis dar susiduria su dideliais sunkumais. Tikimasi, kad dirbtinio intelekto plėtra ir gilus mokymasis pagerins DIA duomenų analizės tikslumą ir išsamumą.
Metaproteomikos duomenų analizėje vienas iš pagrindinių žingsnių yra baltymų sekų duomenų bazės sukūrimas. Tokiose populiariose tyrimų srityse kaip žarnyno flora gali būti naudojamos žarnyno mikrobų duomenų bazės, tokios kaip IGC ir HMP, ir buvo pasiekti geri identifikavimo rezultatai. Daugumos kitų metaproteomikos analizių atveju veiksmingiausia duomenų bazės kūrimo strategija vis dar yra sukurti mėginiui būdingą baltymų sekų duomenų bazę, pagrįstą metagenominės sekos duomenimis. Didelio sudėtingumo ir didelio dinaminio diapazono mikrobų bendruomenės mėginiams būtina padidinti sekos nustatymo gylį, kad būtų padidintas mažo gausumo rūšių identifikavimas, taip pagerinant baltymų sekų duomenų bazės aprėptį. Kai trūksta duomenų sekos, viešajai duomenų bazei optimizuoti gali būti naudojamas kartotinis paieškos metodas. Tačiau kartotinė paieška gali turėti įtakos FDR kokybės kontrolei, todėl paieškos rezultatus reikia atidžiai patikrinti. Be to, vis dar verta ištirti tradicinių FDR kokybės kontrolės modelių pritaikymą metaproteomikos analizei. Kalbant apie paieškos strategiją, hibridinės spektrinės bibliotekos strategija gali pagerinti DIA metaproteomikos aprėpties gylį. Pastaraisiais metais prognozuojama spektrinė biblioteka, sukurta remiantis giliu mokymusi, parodė puikų DIA proteomikos našumą. Tačiau metaproteomų duomenų bazėse dažnai yra milijonai baltymų įrašų, o tai lemia didelį nuspėjamų spektrinių bibliotekų mastą, sunaudoja daug skaičiavimo resursų ir sukuria didelę paieškos erdvę. Be to, metaproteomų baltymų sekų panašumas labai skiriasi, todėl sunku užtikrinti spektrinės bibliotekos prognozavimo modelio tikslumą, todėl prognozuojamos spektrinės bibliotekos metaproteomikoje nebuvo plačiai naudojamos. Be to, reikia sukurti naujas baltymų išvadų ir klasifikavimo anotacijos strategijas, kurios būtų taikomos atliekant labai panašių į seką baltymų metaproteomikos analizę.
Apibendrinant galima pasakyti, kad metaproteomikos technologija, kaip nauja mikrobiomų tyrimų technologija, pasiekė reikšmingų tyrimų rezultatų ir taip pat turi didžiulį plėtros potencialą.
Paskelbimo laikas: 2024-08-30