На первом этапе была разработана программно-информационная платформа для информационно-аналитического сопровождения исследований. В ее функции входит сбор, контроль и хранение первичных данных зоотехнического учета, сбор и хранение результатов генотипирования, формирование наборов данных для аналитической обработки в специализированных приложениях. Всего в базе данных проекта содержится 113977 записей животных и 75960 результатов опоросов. С использованием разработанной программно-информационной платформы с целью изучения селекционно-генетических параметров исследуемого поголовья сформированы 2 выборки чистопородных свиней крупной белой породы и ландрас, а также выборка гибридов первого поколения (F1), полученных от скрещивания чистопородных форм (свиноматок крупной белой породы с хряками ландрас). В полученных выборках определены параметры описательной статистики, а также рассчитаны коэффициенты наследуемости, фенотипические и генетические корреляции по признакам общее количество поросят при рождении (TNB), многоплодие (NBA), масса гнезда при рождении (LWB), мертворожденность (DB), сохранность (SF), возраст первого опороса (FFA), скороспелость (A100), среднесуточный прирост (DG). Высокие положительные корреляции (как фенотипические, так и генетические) были установлены по парам признаков TNB-NBA, TNB-LWB, NBA-LWB. Отрицательные корреляции были определены для пар признаков NBA-LWB, TNB-SF, A100-DG. Наряду с этими параметрами на всем совокупном наборе данных было определено наличие и форма проявления эффекта гетерозиса в гибридном поколении по признакам воспроизводительной продуктивности. В результате было установлено, что гетерозис устойчиво проявляется в формах полного и сверхдоминирования по большинству показателей в первом, втором и третьем опоросе. С целью расширения информационной базы исследований планом проекта предусмотрено полногеномное генотипирование гибридных свиноматок. Для этого, с учетом проведенного статистического анализа сформирована однородная репрезентативная группа свиноматок численностью 1527 гол. Из этой группы были выбраны 480 животных для генотипирования. От них получены образцы биологического материала, по которым выполнено генотипирование на платформе GeneSeek GGP Porcine HD. Идентифицированные SNP протестированы на качество по общепринятым методикам. С целью отбора наиболее эффективных методов полногеномного поиска ассоциаций (GWAS), с использованием симуляционных данных GEAR-fastGRM(https://github.com/gc5k/GEAR/) выполнен сравнительный анализ основных существующих подходов: - на основе линейных моделей; - методами, основанными на геномной матрице родства и формулах Бейеса - с использованием алгоритмов машинного обучения. В результате наилучшие результаты показали алгоритмы машинного обучения: Случайный лес (Random Forest, RF), Машина градиентного спуска (Gradient Boosting Machine, GBM), Глубокое обучение (Deep Learning, Deep). Эти алгоритмы определены в качестве инструментов дальнейшего анализа. На основе этих алгоритмов был выполнен GWAS с целью выявления SNPs, оказывающих значимое влияние на воспроизводительные качества свиноматок. Исследования проведены на свиньях крупной белой породы (n=702) с использованием трех алгоритмов машинного обучения (RF, GBM, Deep) и свиньях породы ландрас (n=360) на основе алгоритма GBM с учетом аддитивных и доминантных эффектов. Определены наиболее важные SNPs, связанные с количеством поросят при рождении. Представлена дополнительная ценность учета доминантного эффекта для выявления геномных областей, контролирующих исследуемые признаки. Дальнейшие исследования позволят более детально изучить генетическую архитектуру признаков плодовитости свиней на основе проведения ассоциативного анализа по признакам количества живых поросят и массы гнезда при рождении у чистопородных (крупная белая и ландрас) и гибридных свиноматок F1 .
Отчет за 2020 год.
В отчетном периоде выполнен комплекс работ по полногеномному генотипированию свиноматок крупной белой породы (КБ), породы ландрас (Л) и гибридных свиноматок (F1) (всего 336 гол.). Животных генотипировали, используя GGP_HD_Porcine. Таким образом, общее количество животных в базе данных информационной платформы исследований, по которым получены полногеномные данные, составило 657 гол. Из этих животных была сформирована выборка для проведения ассоциативных исследований на основе алгоритмов машинного обучения с учетом аддитивных и неаддитивных эффектов у чистопородного и гибридного поголовья и определения наиболее важных SNPs для воспроизводительных признаков свиней. Структура выборки по породному составу была следующей: КБ – 179 гол., Л – 94 гол., F1 – 160. SNPs, прошедшие контроль качества, были использованы для ассоциативного анализа с использованием алгоритма машинного обучения Gradient Boosting Machine (GBM). У свиней КБ с учетом аддитивного эффекта определено значимых (relative importance > 0) - 1009 SNPs, с учетом доминантного эффекта – 1058 SNPs. В общем множестве 186 SNPs показали значимость на основе двух моделей. У свиней Л с учетом аддитивного эффекта определено 161 SNPs, с учетом доминантного эффекта – 149 SNPs, при этом 12 SNPs показали значимость на основе двух моделей. У свиней F1 с учетом аддитивного эффекта определено 1877 SNPs, с учетом доминантного эффекта – 1834 SNPs, из которых 229 SNPs показали значимость на основе двух моделей. Изучена локализация идентифицированных SNP в областях QTLs и генах (либо близлежащих). Поиск QTL проводили в Ensembl genome browser (Sscrofa 11.1) (https://www.ensembl.org/index.html). Среди репродуктивных признаков (Reproduction traits) наиболее представлены признаки плодовитости (Litter traits): число желтых тел (Corpus_luteum_number); количество всех поросят при рождении (Litter_size или TNB); количество живых поросят при рождении (Total_number_born_alive или NBA), а также признаки, характеризующие репродуктивные органы (Reproductive organ) и в частности, общее количество сосков (Teat_number), количество левых и правых сосков (Left_teat_number и Right_teat_number). Следует отметить локусы, связанные с экстерьерными показателями (Exterior traits): поведением (Behavioral), конформацией (Conformation) и дефектами (Defects); а также с признаками здоровья (Health Traits): параметрами крови (Blood parameters), восприимчивости к заболеваниям (Disease susceptibility) и иммунитетом (Immune capacity). Проведен анализ генной онтологии (GO) по базе PANTHER с целью функционального анализа генов, в которых локализованы идентифицированные SNP. В результате было установлено, что относительно молекулярных функций эти гены, в большей степени, ответственны за связывание рецепторов (binding GO:0005488) и катализ биохимических реакций (catalytic activity GO:0003824). Относительно биологических процессов: с биологическим регулированием (biological regulation GO:0065007) и клеточными процессами (cellular process GO:0009987). Относительно классов белков: белки, кодируемые этими генами, относятся к классам цитоскелетных белков (cytoskeletal protein PC00085), ферментам взаимного превращения метаболитов (metabolite interconversion enzyme PC00262), рецепторам трансмембранных сигналов (transmembrane signal receptor PC00197) и транспортерам (transporter PC00227). Интересно отметить, что несмотря на то, что у свиней КБ, Л и F1 большинство значимых SNP локализованы в различных генах, однако молекулярные, биологические функции и классы белков у них практически идентичны. Проведен анализ идентифицированных SNP и генов, являющихся общими для разных пород. У свиней крупной белой породы и породы ландрас определили 13 общих SNPs, из которых 6 SNPs локализованы в генах ZNF385D, PTPRT, CDYL2, DNPH1, CUL9 и C1orf21. У свиней крупной белой породы и гибридных свиноматок F1 определили 136 общих SNPs, из которых 63 SNPs локализованы в генах, среди которых можно отметить PTPRK, PAPP-A, TLK2. У свиней ландрас и гибридных свиноматок F1 определили 27 общих SNPs, из которых 16 SNPs локализованы в генах NLK, RIMS4, UNC93B1, ADD2, OXR1 и PDE4B. По указанным генам проведен обор литературных данных на предмет их ассоциаций с какими-либо признаками у людей и животных. Проведены исследования генома чистопородных и гибридных свиней с целью поиска сегментов гомозиготного происхождения (HBD). Исследования проводили на 657 свиньях, включая КБ (n=280), Л (n=218) и F1(n=159). Для идентификации сегментов HBD и оценки аутозиготности (или коэффициента инбридинга) использовали модель множественных HBD классов (the multiple HBD classes model), представленную в RZooRoH package (Druet, Gautier, 2017 ; Bertrand et al., 2019 ). У КБ определено 50 420 сегментов HBD, в среднем 180 на одного животного; у Л- 33 586, в среднем 154 на одного животного; у F1 - 21 068, в среднем 132 на одного животного. Наибольшая длина сегментов HBD определена у КБ (203,93 Mb, 3784 SNPs, SSC13). Средняя длина сегментов HBD у чистопородных свиней составила около 3,20-3,37 Mb (78-83 SNPs), у F1 – 1,70 Mb (40 SNPs). Уровень геномного инбридинга составил у КБ - 0,24, Л - 0,22 и F1 -0,11 процентов от генома.