§ 74. Обсуждение

Разработанная система Gene Discovery помогает нам находить комплексные сигналы в области промотера. Функциональное значение сигнала можно рассматривать в терминах сайтов связывания транскрипционных факторов или конформационных свойств ДНК.

Автоматическая генерация правил для функциональной аннотации генов может использовать и другие методы извлечения знаний. Для предсказания функционального класса генов мы планируем объединить результаты других методов, дающих элементарные сигналы, которые могут быть использованы системой Gene Discovery для обнаружения комплексных сигналов, связанных не только с сигналами контекста регулирующих областей.

Проведенный анализ дает большое число комплексных сигналов для промотеров эндокринной системы и промотеров эритроид-специфичных генов. Функциональное значение комплексных сигналов подтверждено похожестью расположением олигонуклеотидных мотивов относительно старта транскрипции и похожими расстояниями между этими мотивами.

Частным типом комплексных сигналов являются, так называемые, композиционные элементы [http://compel.bionet.nsc.ru/]. Композиционный элемент формируется парой транскрипционных факторов, которые приобретают новые регулирующие свойства из-за взаимодействия белка с белком. Такое взаимодействие обеспечивает большую экспрессию транскрипции. Анализ закономерностей, найденных системой Gene Discovery дает новый подход для компьютерного обнаружения композиционных элементов.

Доступные экспериментальные данные и специализированные молекулярно-биологические базы данных содержат большое количество экспериментальных результатов для последовательностей ДНК, вовлеченных в регулирование транскрипции. В настоящее время больше чем 300 молекулярно-биологических баз данных доступны в Интернет, и это число продолжает расти. Это обеспечивает большие возможности для анализа данных и извлечения знаний в биоинформатике.

Наш подход мы применили в основном для анализа регуляторных районов генов. В дальнейшем мы предполагаем проанализировать контекстную структуру генов для всех уровней генной иерархии: генов в целом, регуляторных областей генов, промотеров, сайтов связывания транскрипционных факторов, 5'UTR, сайтов сплайсинга.