Перейти до вмісту

AlphaFold

Матеріал з Вікіпедії — вільної енциклопедії.

AlphaFoldпрограма штучного інтелекту (ШІ), розроблена компанією DeepMind (дочірня компанія Alphabet Inc.), призначена для передбачення тривимірної структури білків. Використовує методи глибокого навчання.

Історія розвитку

[ред. | ред. код]

AlphaFold 1 (2018)

[ред. | ред. код]

У грудні 2018 року перша версія AlphaFold посіла перше місце в загальному заліку 13-го Критичного оцінювання методів передбачення структури білків (CASP13). Програма виявилася особливо успішною у передбаченні найбільш точних структур для цілей, які організатори змагання оцінили як найскладніші.

AlphaFold 2 (2020)

[ред. | ред. код]

У листопаді 2020 року AlphaFold 2 повторив це досягнення на змаганні CASP14 з набагато вищим рівнем точності порівняно з будь-яким іншим учасником. Програма досягла рівня точності вище 90 балів за глобальним тестом відстані (GDT) для приблизно двох третин білків, що є показником схожості між обчислювально передбаченою структурою та експериментально визначеною структурою, де 100 означає повний збіг.

Результати AlphaFold 2 на CASP14 були описані як "приголомшливі" та "трансформаційні". 15 липня 2021 року стаття про AlphaFold 2 була опублікована в журналі Nature разом з програмним забезпеченням з відкритим вихідним кодом та базою даних протеомів видів з можливістю пошуку.

AlphaFold 3 (2024)

[ред. | ред. код]

8 травня 2024 року було оголошено про створення AlphaFold 3, який може передбачати структуру комплексів, утворених білками з ДНК, РНК, різними лігандами та іонами. Новий метод передбачення показує мінімальне 50% покращення точності для взаємодії білків з іншими молекулами порівняно з існуючими методами.

Нобелівська премія

[ред. | ред. код]

Деміс Гассабіс та Джон Джампер з Google DeepMind розділили половину Нобелівської премії з хімії 2024 року, нагороджені "за передбачення структури білка", тоді як інша половина премії дісталася Девіду Бейкеру "за обчислювальне проектування білка".[1] Раніше, у 2023 році, Гассабіс та Джампер отримали Breakthrough Prize у галузі наук про життя та Премію Альберта Ласкера за фундаментальні медичні дослідження за керівництво проектом AlphaFold.

Принцип роботи

[ред. | ред. код]

DeepMind навчила програму на понад 170 000 білках з Банку даних білків (PDB), публічного репозиторію послідовностей та структур білків. Програма використовує форму мережі уваги — техніку глибокого навчання, яка фокусується на тому, щоб ШІ визначав частини більшої проблеми, а потім з'єднував їх для отримання загального рішення.

Архітектура AlphaFold 2

[ред. | ред. код]

Версія 2020 року суттєво відрізняється від оригінальної версії, що виграла CASP 13 у 2018 році. AlphaFold 2 замінив систему окремо навчених модулів на систему взаємопов'язаних підмереж, формуючи єдину наскрізну модель на основі розпізнавання образів. Ключовою частиною системи 2020 року є два модулі на основі архітектури трансформера, які використовуються для поступового уточнення інформації про взаємозв'язки між амінокислотними залишками білка.

AlphaFold 3: нова архітектура

[ред. | ред. код]

AlphaFold 3 впроваджує "Pairformer" — архітектуру глибокого навчання, натхненну трансформером, яка вважається схожою, але простішою за Evoformer, використаний в AlphaFold 2. Початкові передбачення модуля Pairformer уточнюються за допомогою дифузійної моделі.

База даних AlphaFold

[ред. | ред. код]

База даних структур білків AlphaFold — спільний проект AlphaFold та EMBL-EBI — був запущений 22 липня 2021 року. На момент запуску база даних містила передбачені AlphaFold моделі для майже повного протеому UniProt людини та 20 модельних організмів, загалом понад 365 000 білків.

28 липня 2022 року команда завантажила в базу даних структури близько 200 мільйонів білків з 1 мільйона видів, охопивши майже кожен відомий білок на планеті.[2]

Застосування

[ред. | ред. код]

Дослідження COVID-19

[ред. | ред. код]

AlphaFold був використаний для передбачення структур білків SARS-CoV-2, збудника пандемії COVID-19. Результати були переглянуті науковцями з Інституту Френсіса Кріка у Великій Британії перед передачею ширшій науковій спільноті. Команда також підтвердила точне передбачення експериментально визначеного шипоподібного білка SARS-CoV-2, який був розміщений у Банку даних білків.

Відкриття ліків

[ред. | ред. код]

Передбачення структури білків, як очікується, матиме значні переваги у науках про життя — прискорення відкриття ліків та покращення розуміння захворювань. AlphaFold дозволяє вченим швидко визначати потенційні мішені для нових ліків.

Дослідження білків

[ред. | ред. код]

База даних AlphaFold використовується дослідниками в усьому світі для вивчення структур білків, що раніше були невідомі, та для прискорення наукових досліджень у галузі структурної біології, біохімії та молекулярної біології.

Обмеження

[ред. | ред. код]

Незважаючи на вражаючий успіх, AlphaFold має певні обмеження:

  • База даних AlphaFold надає моделі окремих білкових ланцюгів (мономерів), а не їхніх біологічно релевантних комплексів
  • Багато білкових регіонів передбачаються з низьким показником достовірності, включаючи невпорядковані білкові регіони
  • Модель значною мірою покладається на коеволюційну інформацію від подібних білків, тому може працювати гірше на синтетичних білках
  • Здатність моделі передбачати множинні нативні конформації білків обмежена
  • Під час моделювання залишки переміщуються вільно, без будь-яких обмежень, тому AlphaFold може створювати топологічно невірні результати

Відзнаки та визнання

[ред. | ред. код]

Досягнення AlphaFold 2 отримало широке висвітлення в медіа та визнання наукової спільноти. Венкатраман Рамакрішнан, лауреат Нобелівської премії та структурний біолог, назвав результат "приголомшливим прогресом у вирішенні проблеми згортання білка".

Вихідний код

[ред. | ред. код]

Відкритий доступ до вихідного коду кількох версій AlphaFold (за винятком AlphaFold 3) був наданий DeepMind після запитів наукової спільноти. Вихідний код AlphaFold 3 став доступним для некомерційного використання науковою спільнотою за запитом у листопаді 2024 року.

Джерела

[ред. | ред. код]
  1. The Nobel Prize in Chemistry 2024. NobelPrize.org. 9 жовтня 2024.
  2. Callaway, Ewen (28 липня 2022). 'The entire protein universe': AI predicts shape of nearly every known protein. Nature. 608 (7921): 15—16. doi:10.1038/d41586-022-02083-2. PMID 35902752.

Зовнішні посилання

[ред. | ред. код]