сасава

Микробиска метапротеомика: од обработка на примероци, собирање податоци до анализа на податоци

Ву Енхуи, Кјао Лианг*

Катедра за хемија, Универзитетот Фудан, Шангај 200433, Кина

 

 

 

Микроорганизмите се тесно поврзани со болестите и здравјето на луѓето. Како да се разбере составот на микробните заедници и нивните функции е големо прашање што треба итно да се проучи. Во последниве години, метапротеомиката стана важно техничко средство за проучување на составот и функцијата на микроорганизмите. Сепак, поради сложеноста и високата хетерогеност на примероците од микробната заедница, обработката на примероците, стекнувањето податоци од масената спектрометрија и анализата на податоците станаа трите главни предизвици со кои моментално се соочува метапротеомиката. Во метапротеомската анализа, често е неопходно да се оптимизира предтретманот на различни типови примероци и да се усвојат различни шеми за сепарација, збогатување, екстракција и лиза на микроби. Слично на протеомот на еден вид, режимите за стекнување податоци за масена спектрометрија во метапротеомиката вклучуваат режим на стекнување зависни од податоци (DDA) и режим на стекнување независно од податоци (DIA). Режимот за стекнување податоци DIA може целосно да ги собере информациите за пептидите од примерокот и има голем потенцијал за развој. Сепак, поради сложеноста на примероците на метапротеомите, нејзината анализа на податоците од ДИА стана главен проблем што го попречува длабокото покривање на метапротеомите. Во однос на анализата на податоците, најважниот чекор е изградбата на база на податоци за протеинска секвенца. Големината и комплетноста на базата на податоци не само што имаат големо влијание врз бројот на идентификации, туку влијаат и на анализата на видови и функционални нивоа. Во моментов, златниот стандард за изградба на база на податоци за метапротеом е база на податоци за протеинска секвенца базирана на метагеномот. Во исто време, методот за филтрирање на јавна база на податоци базиран на итеративно пребарување исто така е докажано дека има силна практична вредност. Од перспектива на специфични стратегии за анализа на податоци, методите за анализа на податоци ДИА центрирани на пептиди окупираа апсолутна мејнстрим. Со развојот на длабокото учење и вештачката интелигенција, тоа во голема мера ќе ја промовира точноста, покриеноста и брзината на анализа на макропротеомската анализа на податоци. Во однос на низводно биоинформатичката анализа, во последниве години се развиени низа алатки за прибележување, кои можат да вршат прибелешки на видовите на ниво на протеини, ниво на пептиди и ниво на ген за да се добие составот на микробните заедници. Во споредба со другите методи на омика, функционалната анализа на микробните заедници е единствена карактеристика на макропротеомиката. Макропротеомиката стана важен дел од мулти-омската анализа на микробните заедници и сè уште има голем развоен потенцијал во однос на длабочината на покриеноста, чувствителноста на откривање и комплетноста на анализата на податоците.

 

01Преттретман на примерок

Во моментов, технологијата на метапротеомика е широко користена во истражувањето на човечкиот микробиом, почвата, храната, океаните, активната тиња и други полиња. Во споредба со анализата на протеомот на еден вид, предтретманот на примерокот на метапротеомот на сложените примероци се соочува со повеќе предизвици. Микробиолошкиот состав во вистинските примероци е сложен, динамичкиот опсег на изобилство е голем, структурата на клеточниот ѕид на различни видови микроорганизми е многу различна, а примероците често содржат голема количина на протеини домаќини и други нечистотии. Затоа, при анализата на метапротеомот, често е неопходно да се оптимизираат различни типови на примероци и да се усвојат различни шеми за сепарација, збогатување, екстракција и лиза на микроби.

Екстракцијата на микробни метапротеоми од различни примероци има одредени сличности, како и некои разлики, но моментално недостига унифициран процес на претходна обработка за различни типови примероци на метапротеом.

 

02 Стекнување податоци од масена спектрометрија

Во анализата на протеомот од пушка, пептидната мешавина по предтретман најпрво се одвојува во хроматографската колона, а потоа влегува во масениот спектрометар за добивање податоци по јонизацијата. Слично на анализата на протеомот од еден вид, режимите на стекнување податоци за масена спектрометрија во анализата на макропротеомот вклучуваат DDA режим и режим DIA.

 

Со континуираното повторување и ажурирање на инструментите за масена спектрометрија, инструментите за масена спектрометрија со поголема чувствителност и резолуција се применуваат на метапротеомот, а длабочината на покриеноста на анализата на метапротеомот исто така континуирано се подобрува. Долго време, низа инструменти за масена спектрометрија со висока резолуција на чело со Орбитрап се широко користени во метапротеомот.

 

Табелата 1 од оригиналниот текст покажува неколку репрезентативни студии за метапротеомијата од 2011 година до денес во однос на типот на примерокот, стратегијата за анализа, инструментот за масена спектрометрија, методот на стекнување, софтверот за анализа и бројот на идентификации.

 

03Анализа на податоци од масена спектрометрија

3.1 Стратегија за анализа на податоци на DDA

3.1.1 Пребарување во бази на податоци

3.1.2де новостратегија за секвенционирање

3.2 Стратегија за анализа на податоци за ДИА

 

04Класификација на видови и функционална прибелешка

Составот на микробиолошки заедници на различни таксономски нивоа е една од клучните истражувачки области во истражувањето на микробиомот. Во последниве години, развиени се серија алатки за прибележување за да се прибележат видовите на ниво на протеини, нивоа на пептиди и ниво на гени за да се добие составот на микробните заедници.

 

Суштината на функционалната прибелешка е да се спореди целната протеинска секвенца со базата на податоци за функционална протеинска секвенца. Користејќи ги базите на податоци за генски функции, како што се GO, COG, KEGG, eggNOG, итн., може да се извршат различни функционални анализи на прибелешки на протеините идентификувани со макропротеомите. Алатките за прибележување вклучуваат Blast2GO, DAVID, KOBAS итн.

 

05 Резиме и Outlook

Микроорганизмите играат важна улога во човековото здравје и болести. Во последниве години, метапротеомиката стана важно техничко средство за проучување на функцијата на микробните заедници. Аналитичкиот процес на метапротеомиката е сличен на оној на протеомиката од еден вид, но поради сложеноста на истражувачкиот предмет на метапротеомиката, треба да се усвојат специфични стратегии за истражување во секој чекор на анализа, од предтретман на примерокот, стекнување податоци до анализа на податоци. Во моментов, благодарение на подобрувањето на методите за предтретман, континуираната иновација на технологијата за масена спектрометрија и брзиот развој на биоинформатиката, метапротеомиката постигна голем напредок во длабочината на идентификацијата и опсегот на примена.

 

Во процесот на предтретман на примероците од макропротеомот, прво мора да се земе предвид природата на примерокот. Како да се одделат микроорганизмите од клетките и протеините на животната средина е еден од клучните предизвици со кои се соочуваат макропротеомите, а рамнотежата помеѓу ефикасноста на сепарацијата и микробната загуба е итен проблем што треба да се реши. Второ, екстракцијата на протеини на микроорганизмите мора да ги земе предвид разликите предизвикани од структурната хетерогеност на различни бактерии. Примероците на макропротеомите во опсегот на траги бараат и специфични методи за предтретман.

 

Во однос на инструментите за масена спектрометрија, главните инструменти за масена спектрометрија претрпеа транзиција од масени спектрометри базирани на анализатори на масата Orbitrap како што се LTQ-Orbitrap и Q Exactive до масени спектрометри базирани на масени анализатори за време на летот поврзани со мобилност на јони, како што е timsTOF Pro . Серијата timsTOF инструменти со информации за димензијата за мобилност на јони имаат висока точност на откривање, ниска граница за откривање и добра повторливост. Тие постепено станаа важни инструменти во различни истражувачки полиња кои бараат откривање на масена спектрометрија, како што се протеомот, метапротеомот и метаболомот на еден вид. Вреди да се напомене дека долго време, динамичкиот опсег на инструменти за масена спектрометрија ја ограничува длабочината на покриеноста на протеините на истражувањето на метапротеомот. Во иднина, инструментите за масена спектрометрија со поголем динамички опсег може да ја подобрат чувствителноста и точноста на идентификацијата на протеините во метапротеомите.

 

За стекнување на податоци од масена спектрометрија, иако режимот за стекнување податоци DIA е широко прифатен во протеомот на еден вид, повеќето актуелни анализи на макропротеомите сè уште го користат режимот за стекнување податоци DDA. Режимот за собирање податоци DIA може целосно да ги добие информациите за фрагмент јоните на примерокот и во споредба со режимот за стекнување податоци DDA, тој има потенцијал целосно да ги добие информациите за пептидите на примерокот на макропротеомот. Сепак, поради високата сложеност на податоците за ДИА, анализата на податоците за макропротеомите на ДИА сè уште се соочува со големи тешкотии. Развојот на вештачката интелигенција и длабокото учење се очекува да ја подобри точноста и комплетноста на анализата на податоците на DIA.

 

Во анализата на податоците на метапротеомиката, еден од клучните чекори е изградбата на база на податоци за протеинска секвенца. За популарни истражувачки области како што е цревната флора, може да се користат бази на податоци за цревни микроби, како што се IGC и HMP, и постигнати се добри резултати за идентификација. За повеќето други метапротеомски анализи, најефективната стратегија за изградба на базата на податоци е сè уште да се воспостави база на податоци за протеинска секвенца специфична за примерокот врз основа на податоци за метагеномско секвенционирање. За примероци од микробна заедница со висока сложеност и голем динамички опсег, неопходно е да се зголеми длабочината на секвенционирањето за да се зголеми идентификацијата на видовите со мала изобилство, а со тоа да се подобри покриеноста на базата на податоци за протеинската секвенца. Кога недостасуваат податоци за секвенционирање, може да се користи итеративен метод за пребарување за да се оптимизира јавната база на податоци. Сепак, итеративното пребарување може да влијае на контролата на квалитетот на FDR, така што резултатите од пребарувањето треба внимателно да се проверат. Дополнително, сè уште вреди да се истражува применливоста на традиционалните модели за контрола на квалитетот на FDR во метапротеомската анализа. Во однос на стратегијата за пребарување, стратегијата на хибридната спектрална библиотека може да ја подобри длабочината на покриеноста на метапротеомиката на ДИА. Во последниве години, предвидената спектрална библиотека генерирана врз основа на длабоко учење покажа супериорни перформанси во DIA протеомика. Сепак, базите на податоци за метапротеом често содржат милиони протеински записи, што резултира со голем обем на предвидени спектрални библиотеки, троши многу компјутерски ресурси и резултира со голем простор за пребарување. Дополнително, сличноста помеѓу протеинските секвенци во метапротеомите многу варира, што го отежнува обезбедувањето на точноста на моделот за предвидување на спектрална библиотека, така што предвидените спектрални библиотеки не биле широко користени во метапротеомиката. Дополнително, треба да се развијат нови стратегии за заклучување на протеини и класификација за да се применат на метапротеомската анализа на протеините со многу слични секвенци.

 

Накратко, како нова технологија за истражување на микробиомот, технологијата на метапротеомика постигна значителни истражувачки резултати и исто така има огромен потенцијал за развој.


Време на објавување: 30.08.2024