Biopolym. Cell. 2017; 33(6):442-452.
Біоінформатика
Розробка бази даних генної експресії плаценти людини в умовах прееклампсії
1Лихенко А., 1Фролова А., 1Оболенська М. Ю.
  1. Інститут молекулярної біології і генетики НАН України
    Вул. Академіка Заболотного, 150, Київ, Україна, 03680

Abstract

Публікація «сирих» результатів у відкритих репозиторіях надає можливість поєднати дані декількох експе-риментів для інтегративного аналізу, який сприятиме підвищенню статистичної значущості висновків, а відтак і кращому розумінню біологічних явищ. Однак, оскільки дані у відкритих репозиторіях були завантажені незалеж-ними дослідниками за відсутності єдиних стандартів, то назви характеристик зразків (атрибути) виявилися не уні-фікованими, часто неповними та потребують додаткової обробки, перш ніж інтеграція стане можливою. Мета. Розробити спеціалізовану базу даних генної експресії в плаценті людини в умовах прееклампсії як причини високої захворюваності та смертності по всьому світу за невідомої етіології захворювання та його патогенезу. Методи. Метадані експериментів та біологічних зразків були автоматично завантажені з ArrayExpress за допомо-гою Bioservices. Відсутні дані були отримані з бази NCBI, а також із текстів відповідних статей та внаслідок спіл-кування з авторами статей. Метадані були стандартизовані за допомогою словника MeSH та Experimental Factor Ontology. Результати. База даних з більш як 1000 зразків плаценти в нормі та за умов прееклампсії була розроблена і доповнена метаданими, які включають характеристику біологічних зразків, клінічний діагноз, вік жінки, стать плоду, характеристику пологів та інші допоміжні ознаки зразків. Висновки. Біологічні зразки розробленої бази даних охарактеризовані максимально можливою кількістю метаданих, що дозволяє створювати різні групи порів-няння профілів генної експресії. Об’єднання профілів генної експресії (інтеграція) різних зразків на підставі ідентичності метаданих з наступним аналізом об’єднаних даних підвищить статистичну значущість висновків в порівнянні з аналізом результатів окремо взятих дослідів.
Keywords: генетичні бази даних, плацента, прееклампсія, мікромасив олігонуклеотидів, аналіз послідовностей, дані мікоромасивів.

References

[1] Barrett T, Troup DB, Wilhite SE, Ledoux P, Evangelista C, Kim IF, Tomashevsky M, Marshall KA, Phillippy KH, Sherman PM, Muertter RN, Holko M, Ayanbule O, Yefanov A, Soboleva A. NCBI GEO: archive for functional genomics data sets--10 years on. Nucleic Acids Res. 2011;39(Database issue):D1005-10.
[2] Rustici G, Kolesnikov N, Brandizi M, Burdett T, Dylag M, Emam I, Farne A, Hastings E, Ison J, Keays M, Kurbatova N, Malone J, Mani R, Mupo A, Pedro Pereira R, Pilicheva E, Rung J, Sharma A, Tang YA, Ternent T, Tikhonov A, Welter D, Williams E, Brazma A, Parkinson H, Sarkans U. ArrayExpress update--trends in database growth and links to data analysis tools. Nucleic Acids Res. 2013;41(Database issue):D987-90.
[3] Frolova A, Obolenska M. Integrative Approa-c-hes for Data Analysis in Systems Biology: Current Advances. In: Proceedings of Applied Physics and Engineering (YSF), 2016 II International Young Scientists Forum:194–98.
[4] Taminau J, Lazar C, Meganck S, Nowé A. Comparison of Merging and Meta-Analysis as Alternative Approaches for Integrative Gene Expression Analysis. ISRN Bioinform. 2014(2014): 345106.
[5] Walsh CJ, Hu P, Batt J, Santos CC. Microarray Meta-Analysis and Cross-Platform Normalization: Integrative Genomics for Robust Biomarker Discovery. Microarrays (Basel). 2015;4(3):389-406.
[6] Sarkans U, Parkinson H, Lara GG, Oezcimen A, Sharma A, Abeygunawardena N, Contrino S, Holloway E, Rocca-Serra P, Mukherjee G, Shojatalab M, Kapushesky M, Sansone S-A, Farne A, Rayner T, Brazma A. The Ar-rayExpress gene expression database: A software engineering and implementation perspective. Bioinformatics. 2005; 21(8):1495–501.
[7] Leavey K, Bainbridge SA, Cox BJ. Large scale aggregate microarray analysis reveals three distinct molecular subclasses of human preeclampsia. PLoS One. 2015;10(2):e0116508.
[8] Hruz T, Laule O, Szabo G, Wessendorp F, Bleuler S, Oertle L, Widmayer P, Gruissem W, Zimmermann P. GENVESTIGATOR V.3: a reference expression database for the meta-analysis of transcriptomes. Adv Bioinformatics. 2008; (2008):420747.
[9] Zimmermann P, Hirsch-Hoffmann M, Hennig L, Gruissem W. GENEVESTIGATOR. Arabidopsis microarray database and analysis toolbox. Plant Physiol. 2004;136(1):2621-32. Erratum in: Plant Physiol. 2004 Dec;136(4):4335.
[10] Clauzel C, Foltête JC, Girardet X and Vuidel G. GENEVESTIGATOR, a High Performance Search Engine for Gene Expression. User Manual. 2016; no. May: 0–37.
[11] Speake C, Presnell S, Domico K, Zeitner B, Bjork A, Anderson D, Mason MJ, Whalen E, Vargas O, Popov D, Rinchai D, Jourde-Chiche N, Chiche L, Quinn C, Chaussabel D. An interactive web application for the dissemination of human systems immunology data. J Transl Med. 2015;13:196.
[12] Marr AK, Boughorbel S, Presnell S, Quinn C, Chaussabel D, Kino T. A curated transcriptome dataset collection to investigate the development and differentiation of the human placenta and its associated pathologies. Version 2. F1000Res. 2016 Mar 9 [revised 2016 Jan 1];5:305.
[13] Xia J, Fjell CD, Mayer ML, Pena OM, Wishart DS, Hancock RE. INMEX--a web-based tool for integrative meta-analysis of expression data. Nucleic Acids Res. 2013;41(Web Server issue):W63-70.
[14] Nelson DM, Burton GJ. A technical note to improve the reporting of studies of the human placenta. Placenta. 2011;32(2):195-6.