Комп’ютерний метод пошуку в нуклеотидних послідовностях ділянок гомології з можливими вставками/делеціями і оцінка їхньої статистичної значущості
DOI:
https://doi.org/10.7124/bc.0002A1Анотація
Розроблено комп’ютерний метод, що дозволяє виявити всі ділянки гомології із заданими характеристиками (довжина ділянки, кількість розбіжностей, число і розмір делецій/вставок) в одній нуклеотидній послідовності або між двома послідовностями ДНК (РНК) і оцінити статистичну значущість знайдених гомологий. Цей метод особливо ефективний для пошуку потенційних шпилькових структур у нуклеотидних послідовностях, а також може застосовуватися при вирівнюванні двох послідовностей ДНК (РНК).Посилання
Fitch WM. An improved method of testing for evolutionary homology. J Mol Biol. 1966;16(1):9-16.
Needleman SB, Wunsch CD. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol. 1970;48(3):443-53.
de Wachter R. The number of repeats expected in random nucleic acid sequences and found in genes. J Theor Biol. 1981;91(1):71-98.
Brezinski DP. Statistical significance of DNA sequence symmetries. Nature. 1975;253(5487):128-30.
Day GR, Blake RD. Statistical significance of symmetrical and repetitive segments in DNA. Nucleic Acids Res. 1982;10(24):8323-39.
Kolchanov NA, Solov'ev VV, Zharkikh AA. High saturation by direct copies in RNA-polymerase genes based on context analysis data. Dokl Akad Nauk SSSR. 1983;273(3):741-4.
Stormo GD, Schneider TD, Gold L, Ehrenfeucht A. Use of the 'Perceptron' algorithm to distinguish translational initiation sites in E. coli. Nucleic Acids Res. 1982;10(9):2997-3011.
Shakhmuradov IA, Kolchanov NA, Solov'ev VV, Ratner VA. Enhancer-like structures in moderately repetitive sequences of eukaryotic genomes. Genetika. 1986;22(3):357-67.