Причинно-следственный анализ
- Причинно-следственный анализ** (англ. *causal analysis*) — это методология, направленная на установление истинных причинно-следственных связей между явлениями или наблюдаемыми данными. Ключевые задачи такого анализа заключаются в определении причин происходящих событий и выявлении возможностей для изменения их результатов.
- Связь между ассоциацией и причинностью
Традиционный статистический анализ выявляет ассоциативные связи между переменными. Однако совместное распределение двух переменных, например, наличия симптомов и заболевания, не позволяет сделать вывод о том, что изменение одной из них (например, устранение симптомов) приведёт к изменению другой (излечению болезни). Это отражено в известном принципе: «корреляция не подразумевает причинности». На практике связь между двумя величинами может объясняться влиянием сторонних факторов, что делает причинно-следственный анализ особенно ценным, поскольку он помогает отличить простые корреляции от действительных причинных зависимостей.
Основная сложность в изучении причинно-следственных связей заключается в невозможности одновременно наблюдать объект как при наличии, так и при отсутствии воздействия. Это препятствует определению индивидуального эффекта воздействия, поскольку исследователь может зафиксировать лишь один из возможных исходов.
Пусть \(T_i\) обозначает факт воздействия (например, лечения или вмешательства) на объект \(i\), \(Y_{1i}\) — значение результата при воздействии, а \(Y_{0i}\) — значение результата при его отсутствии. Тогда **средний эффект воздействия** (англ. *average treatment effect*, ATE) определяется как:
\[ ATE = \mathbb{E}[Y_1 - Y_0] \]
Более простой для оценки величиной является **средний эффект воздействия на подвергнутых воздействию** (англ. *average treatment effect on the treated*, ATT):
\[ ATT = \mathbb{E}[Y_1 - Y_0 \mid T = 1] \]
На первый взгляд, ATE можно оценить, сравнив средние значения для групп, подвергшихся и не подвергшихся воздействию. Однако такой подход ошибочен. Выражение \(\mathbb{E}[Y_1 \mid T = 1] - \mathbb{E}[Y_0 \mid T = 0]\) отражает лишь ассоциацию. Добавив и вычтя **контрафактический результат** \(\mathbb{E}[Y_0 \mid T = 1]\), получим:
\[ \mathbb{E}[Y_1 \mid T = 1] - \mathbb{E}[Y_0 \mid T = 0] + \mathbb{E}[Y_0 \mid T = 1] - \mathbb{E}[Y_0 \mid T = 1] = \mathbb{E}[Y_1 - Y_0 \mid T = 1] + \mathbb{E}[Y_0 \mid T = 1] - \mathbb{E}[Y_0 \mid T = 0] \]
Первое слагаемое соответствует ATT, а остальные составляющие представляют **смещение**. Это смещение вызвано различиями между группами в условиях отсутствия воздействия. Таким образом, ассоциация может считаться причинно-следственной связью только при выполнении условия \(\mathbb{E}[Y_0 \mid T = 1] = \mathbb{E}[Y_0 \mid T = 0]\), то есть когда группы идентичны до начала воздействия.
- Методы анализа
- Графовые модели
Особую роль в анализе причинности играют графовые модели. В них вершины соответствуют случайным величинам, а рёбра отображают причинно-следственные связи между ними.
В графовых моделях выделяют три основные структуры:
- **Цепочка**: \(A\) является причиной \(B\), а \(B\) — причиной \(C\).
- **Вилка**: одна переменная выступает причиной для двух других.
- **Коллайдер**: переменная, на которую влияют две другие переменные.
Ключевым предположением для корректного причинного вывода является условная независимость переменных. Проверить её можно с помощью понятия **d-отделимости**. Набор вершин \(S\) считается блокирующим путь \(p\), если выполняется одно из условий:
- путь \(p\) содержит вершину из \(S\), из которой исходят дуги;
- путь \(p\) содержит коллайдер, не входящий в \(S\), у которого нет потомков в \(S\).
Если \(S\) блокирует все пути из \(X\) в \(Y\), то он d-отделяет \(X\) и \(Y\), что обозначается как \(X \perp\!\!\!\perp Y \mid S\).
- Применение в машинном обучении
- **Справедливость**: Использование моделей машинного обучения в медицине, юриспруденции, образовании и финансах сталкивается с проблемой справедливости, когда исторические данные несут отпечаток влияния расы, пола, сексуальной ориентации и других признаков. Причинно-следственный анализ помогает выявлять такие смещения и предотвращать дискриминацию.
- **Ложные корреляции**: Модели могут строить прогнозы на основе ложных корреляций. Анализ причинности позволяет снизить их влияние, улучшая обобщающую способность моделей на данных, не входящих в обучающую выборку.
- **Обработка естественного языка**: Исследование причинности в NLP — это активно развивающаяся, хотя ещё малоизученная область. Текст может выступать в роли воздействия, результата или искажающего фактора, становясь объектом причинного анализа. Методы NLP, в частности большие языковые модели, оказываются полезными для решения соответствующих задач.
- **Объяснимость**: Причинно-следственный анализ способствует интерпретации результатов работы моделей и пониманию механизмов, лежащих в их основе.
- Причинно-следственный анализ в науке
- Эпидемиология
С XIX века для установления связи между микроорганизмом и заболеванием применялись постулаты Коха. В 1965 году были предложены критерии Брэдфорда Хилла для выявления причинно-следственных связей в эпидемиологических данных.
Такой анализ также используется для оценки эффективности лечения. В случаях, когда положительный результат не гарантирован, решение о назначении терапии основывается на экспертных знаниях о причинных связях, которые могут отсутствовать для новых заболеваний. Здесь для построения причинно-следственных моделей может применяться машинное обучение.
- Общественные науки
В общественных науках наблюдается рост использования количественных показателей для установления причинности, что повышает качество выводов. В публикации «» авторы подчёркивали необходимость внедрения статистических методов в исследования. Были разработаны инструменты, позволяющие сочетать качественные и количественные подходы в причинно-следственном анализе.
В экономике и политологии такой анализ сопряжён с особыми трудностями из-за сложности изучаемых явлений и невозможности проведения контролируемых экспериментов. Тем не менее, методология и строгость причинных выводов постепенно совершенствуются благодаря развитию технологий, росту числа исследователей и улучшению методов.
Вместе с тем, в общественных науках сохраняется озабоченность тем, что многие исследователи уделяют недостаточно внимания причинно-следственному анализу.
Ссылки[править | править код]
- Causal Inference for The Brave and True
- NIPS 2013 Workshop on Causality
- Causal inference at the Max Planck Institute for Intelligent Systems Tübingen
- https://ftp.cs.ucla.edu/pub/stat_ser/r350.pdf|volume=3|pages=96—146|year=2009|language=en|doi=10.1214/09-SS057|issn=1935-7516}}
- https://crl.causalai.net/|title=Causal
- https://causalai.net/r90.pdf|volume=17|issue=3|pages=1-238|last2=Bareinboim|first2=Elias|year=2024|doi=10.1561/2200000106|lang=en}}
- http://www.edwardtufte.com/tufte/hill
- https://web.archive.org/web/20210219104245/https://www.edwardtufte.com/tufte/hill
- https://books.google.com/books?id=YcdlPWPJRBcC|title=Designing
- https://web.archive.org/web/20210721102124/https://books.google.com/books?id=YcdlPWPJRBcC|url-status=live}}
- https://www.cambridge.org/core/books/multimethod-social-science/286C2742878FBCC6225E2F10D6095A0C|title=Multi-Method
- https://web.archive.org/web/20210721102124/https://www.cambridge.org/core/books/multimethod-social-science/286C2742878FBCC6225E2F10D6095A0C|url-status=live}}
- https://doi.org/10.1177/0022343313499597|journal=Journal
- https://web.archive.org/web/20210815141548/https://journals.sagepub.com/doi/10.1177/0022343313499597|url-status=live|url-access=subscription}}
- https://ftp.cs.ucla.edu/pub/stat_ser/r350.pdf
- https://crl.causalai.net/
- https://causalai.net/r90.pdf
- https://books.google.com/books?id=YcdlPWPJRBcC
- https://www.cambridge.org/core/books/multimethod-social-science/286C2742878FBCC6225E2F10D6095A0C
- https://doi.org/10.1177/0022343313499597