Основной вычислительной задачей, поставленной перед Центром высокопроизводительных вычислений,  является сборка (ассемблирование) генома сибирской лиственицы и сибирской кедровой сосны - основных видов хвойных бореальных лесов Сибири, являющихся лесным резервом России. Геномы хвойных уникальны по размеру (в 4-7 раз больше генома человека) и очень сложны для изучения. По мере развития планируются  генетические исследования геномов других хозяйственно-важных видов растений и животных, а также, медико-генетические исследования генома человека.

На базе Центра геномных исследований и Центра высокопроизводительных вычислений СФУ выполняются работы по созданию сервиса для решения широкого круга задач в области геномных исследований и клинической геномики. 

Сервис предполагает включение в него специализированного биохимического оборудования, высокопроизводительного оборудования с уникальными характеристиками, специализированного проприетарного ПО и ПО с открытым кодом (Рисунок 1), что  позволит  обеспечить биологов и медиков возможностями реконструировать и анализировать последовательности полного генома человека, животных, растений. 

Рисунок 1. Схема организации сервиса геномных исследований

 

Реализация сервиса предполагает: 

• развертывание комплекса оборудования для секвенирования генома; 

• создание специализированного высокопроизводительного комплекса с объемом оперативной памяти от 2 до 3 Тб, с набором специализированного программного обеспечения с открытым кодом и проприетарным ПО, реализующего широкий диапазон задач биоинформатики. Комплекс обеспечит эффективную обработку и хранение данных, производимых Центром геномных исследований СФУ. 

• создание и адаптацию биоинформатических алгоритмов для гибридных кластерных систем. 

• создание облачного сервиса, предоставляющего интерфейс обработки задач биоинформатики на распределенных суперкомпьютерных ресурсах.

 

Уже внедрено и работает следующее оборудование 

в том числе уникальный, для региона, специализированный вычислительный комплекс с суммарным объемом ОЗУ больше 3 Тб и с возможностью расширения памяти до 12 Тб. 

 

В состав комплекса входят:

96 ядерный SMP сервер IBM x3950 X6 с объемом ОЗУ 3 ТБ;

 

Гибридный счетный сервер IBM dx360 M4 c двумя GPU NVIDIA Tesla K20 обеспечивающий суммарную пиковую производительность для вычислений одинарной точности с плавающей точкой до 7 Tflops;

Подсистема хранения данный IBM Storwize V3700 объемом 72 Тб.

 IBM Storwize V3700

Комплекс работает под управлением ОС Centos7, установлена параллельная файловая система IBM GPFS, система мониторинга Ganglia, система пакетной обработки Torque. 

Развернуто специализированное ПО для обработки геномной информации в том числе геномные ассемблеры CLC Assembler Cell, ABySS, MaSuRCA,  SPAdes, Platanus, ПО Blast, BWA. 

Результаты представлены в следующих публикациях:

1. Oreshkova N.V., Putintseva Yu.A., Kuzmin D.A., Sharov V.V., Biryukov V.V., Makolov S.V., Deych K.O., Ibe A.A., Shilkina E.A., Krutovsky K.V. The whole de novo genome sequencing and assembly of Siberian larch (Larix sibirica Ledeb.) and Siberian pine (Pinus sibirica Du Tour.) // The 3rd International Conference «Plant genetics, genomics, bioinformatics and biotechnology» (PlantGen 2015) June 17-21, 2015. Novosibirsk, Russia, P. 37

2. Krutovsky K.V., Oreshkova N.V., Putintseva Yu.A., Kuzmin D.A., Sharov V.V., Biryukov V.V., Makolov S.V., Deych K.O., Bondar E.I., Ushakova O.A., Ibe A.A., Shilkina E.A. De novo sequencing of conifer megagenomes // The 3rd International Conference «Plant genetics, genomics, bioinformatics and biotechnology» (PlantGen 2015) June 17-21, 2015. Novosibirsk, Russia, P. 28.
3. Putintseva Yu.A., Sharov V.V., Kuzmin D.A., Makolov S.V., Oreshkova N.V., Krutovsky K.V. Challenges of assembling huge conifer genomes // The 3rd International Conference «Plant genetics, genomics, bioinformatics and biotechnology» (PlantGen 2015) June 17-21, 2015. Novosibirsk, Russia, P. 43.

4. Орешкова Н.В., Путинцева Ю.А., Кузмин Д.А., Шаров В.В.., Бирюков В.В., Дейч К.О., Ибе A.A., Шилкина E.A., Крутовский К.В. Секвенирование и сборка геномов лиственницы сибирской (Larix sibirica Ledeb.) и сосны кедровой сибирской (Pinus sibirica Du Tour) и предварительные данные анализа транскриптома // Материалы 4-го Международного совещания по сохранению лесных генетических ресурсов Сибири, Барнаул, 2015, С. 127-129.

5. Krutovsky K.V., Oreshkova N.V., Putintseva Yu.A., Pavlov I.N., Kuzmin D.A., Sharov V.V., Biryukov V.V., Makolov S.V., Deych K.O., Bondar E.I., Ushakova O.A., Ibe A.A., Shilkina E.A., Sadovsky M.G., Vaganov E.A. Pinus sibirica and Larix sibirica whole genome de novo sequencing// ProCoGen final open conference Promoting Conifer Genomic Resources 30th November – 2nd December 2015 Orléans, France, P. O-07