Биостатистика в генетических исследованиях

Анализ ДНК-штрихкодов пациентов и составление таблиц частотностей ДНК.

Задача

Научно-исследовательский институт онкологии в США проводит исследования генетической предрасположенности к раковым заболеваниям. Учёные одной из лабораторий предложили использовать для этого метод ДНК-штрихкодирования. Эта технология основывается на интенсивных статистических вычислениях, для выполнения которых лаборатории потребовалось специальное программное обеспечение.

Решение

Программисты компании «Аксмор» разработали программу, которая анализирует ДНК пациентов, зашифрованные в штрихкодах, и составляет таблицу частотностей этих штрихкодов. С помощью таких таблиц учёные делают выводы о генетической предрасположенности к онкологическим заболеваниям.

Функциональные возможности решения
1
Повышение качества эксперимента

Для получения более достоверных результатов компьютерная программа сначала сравнивает ДНК-штрихкоды пациентов с имеющимися образцами правильных штрихкодов. Это позволяет исследователям обнаружить и исправить некоторые ошибки, возникающие при кодировании ДНК в штрихкоды.

2
Статистический анализ штрихкодов

Реализации алгоритма анализа ДНК-штрихкодов потребовала от нас применения широкого спектра методов статистического анализа и прогнозирования, которые используются в биоинформатике. Среди них методы Монте-Карло с цепями Маркова (Markov chain Monte-Carlo), метод повторной выборки (Resampling), оценка уровня ложноположительных результатов (False discovery rate) и другие.

3
Многопоточная обработка данных

Компьютерная программа способна одновременно анализировать ДНК-штрихкоды нескольких пациентов. При этом полученные результаты в таблице частотностей ДНК-штрихкодов отображаются отдельно для каждого пациента.

Результат
  • Достигнута максимально возможная скорость линейной обработки ДНК-штрихкодов благодаря использованию древовидной структуры данных.
  • В 16 раз увеличена максимально возможная скорость обработки данных за счёт применения параллельных вычислений.
  • Увеличена скорость выделения и освобождения ресурсов оперативной памяти путём выделения и освобождения сразу больших блоков (paged memory allocation).
  • На 25% уменьшен используемый объём оперативной памяти для 64-битной аппаратной платформы компьютера.
Мы найдем лучшее решение вашей задачи