Biopolym. Cell. 2017; 33(5):379-392.
Біоінформатика
Індуктивна технологія об’єктивної кластеризації профілів експресій генів на основі алгоритму кластеризації SOTA
1Бабічев С. А., 2Гожий О., 3Корнелюк О. І., 4Литвиненко В. І.
  1. Університет Яна Євангеліста Пуркине в Усті-над-Лабем
    вул. Пастера 1, Усті-над-Лабем, Чехія, 400 96
  2. Чорноморський національний університет імені Петра Могили
    вул. 68 Десантників, 10, Миколаїв, Україна, 54003
  3. Інститут молекулярної біології і генетики НАН України
    вул. Академіка Заболотного, 150, Київ, Україна, 03680
  4. Херсонський національний технічний університет
    Бериславське шосе, 24, Херсон, Україна, 73008

Abstract

Мета. Розробка індуктивної технології об'єктивної кластеризації профілів експресій генів на основі самоорганізуючого алгоритму кластеризації SOTA. Методи. Індуктивні методи аналізу складних систем було використано у якості базової основи при створенні індуктивної технології об'єктивної кластеризації профілів експресій генів. Оптимальні параметри роботи алгоритму кластеризації визначалися на основі комплексного використання внутрішніх та зовнішніх критеріїв якості кластеризації та комплексного критерію балансу. Результати. У статті представлено архітектуру індуктивної технології об'єктивної кластеризації на основі алгоритму кластеризації СОТА та покрокова процедура її реалізації. У процесі моделювання було отримано графікі залежності внутрішніх, зовнішніх та комплексного критерію балансу від параметрів роботи алгоритму кластеризації, аналіз яких дозволяє визначити оптимальні параметри роботи алгоритму кластеризації. Висновки. Отримані результати моделювання показали високу ефективність запропонованої технології. У випадку обробки профілів експресій генів дана технологія створює умови для реалізації покрокової кластер-бікластер технології групування даних на ранньому етапі реконструкції генної регуляторної мережі.
Keywords: , , , ,

References

[1] Pontes B, Giráldez R, Aguilar-Ruiz JS. Biclustering on expression data: A review. J Biomed Inform. 2015;57:163-80.
[2] Chi EC, Allen GI, Baraniuk RG. Convex Biclustering. Biometrics. 2017; 73(1):10-9.
[3] Madala HR, Ivakhnenko AG. Inductive Learning Algorithms for Complex Systems Modeling. CRC Press, 1993. 384 p.
[4] Osypenko VV. Two approaches to solving the problem of clustering in the broad sense from the standpoint of inductive modeling. Power and Automation. 2014; 1: 83-97.
[5] Sarycheva LV. Objective cluster analysis of the data on the basis of the group method of data handling. Problem of Management and Informatics. 2008; 2: 86-19.
[6] Ivakhnenko AG. Inductive method for self-organizing of complex systems models. Kiev: Naukova Duka, 1982. 296 p.
[7] Ivakhnenko AG. Objective clustering based on the theory of self-organizing models. Automatics. 1987; 5: 6-10.
[8] Babichev S, Lytvynenko V, Korobchynskyi M, Osypenko V. Objective clustering inductive technology of gene expression profiles features. Communications in Computer and Information Science. Proceeding of the 13th International Conference Beyond Databases, Architectures and Structures (BDAS 2017), Ustron, Poland. 2017; 359-14.
[9] Babichev S, Taif MA, Lytvynenko V. Inductive model of data clustering based on the agglomerative hierarchical algorithm. Proceeding of the 2016 IEEE First International Conference on Data Stream Mining and Processing (DSMP 2016), Lviv. 2016; 19-4.
[10] Babichev S, Taif MA, Lytvynenko V, Osypenko V. Criterial analysis of the gene expression sequences to create the objective clustering inductive technology. Proceeding of the 2017 IEEE 37th International Conference on Electronics and Nanotechnology (ELNANO 2017), Kiev, Ukraine. 2017; 244-5.
[11] Calinski T, Harabasz J. A dendrite method for cluster analysis. Commun Stat. 1974; 3(1): 1-27.
[12] Zhao Q, Xu M, Fränti P. Sum-of-squares based cluster validity index and significance analysis. Proceeding of International Conference on Adaptive and Natural Computing Algorithms. 2009; 313-10.
[13] Harrington J. The desirability function. Industrial Quality Control. 1965; 21(10): 494-5.
[14] Dopazo J, Carazo JM. Phylogenetic reconstruction using an unsupervised growing neural network that adopts the topology of a phylogenetic tree. J Mol Evol. 1997;44(2):226-33.
[15] Fritzke B. Growing cell structures a self-organizing network for unsupervised and supervised learning. Neural Netwo. 1994; 7(9): 1441-20.
[16] Beer DG, Kardia SL, Huang CC, Giordano TJ, Levin AM, Misek DE, Lin L, Chen G, Gharib TG, Thomas DG, Lizyness ML, Kuick R, Hayasaka S, Taylor JM, Iannettoni MD, Orringer MB, Hanash S. Gene-expression profiles predict survival of patients with lung adenocarcinoma. Nat Med. 2002;8(8):816-24.
[17] Charytanowicz M, Niewczas J, Kulczycki P, Kowalski PA, Lukasik S, Zak S. A complete gradient clustering algorithm for features analysis of X-ray Images. Information Technologies in Biomedicine. Springer-Verlag, Berlin-Heidelberg. 2002; 15-24.
[18] Fisher RA. The use of multiple measurements in taxonomic problems. Ann Hum Genet. 1936; 7(2): 179-188. DOI:
[19] Babichev SA, Kornelyuk AI, Lytvynenko VI, Osypenko VV. Computational analysis of microarray gene expression profiles of lung cancer. Biopolym Cell. 2016; 32(1): 70-9.