Эффект Даннинга-Крюгера — автокорреляция

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

даннинг-крюгеравтокорреляциястатистика

Специально для читателей нашего канала мы перевели статью Блейра Фикса о том, почему эффект Даннинга-Крюгера — просто автокорреляция, то есть корреляция переменной с самой собой. Автор подробно объясняет природу автокорреляции, находит её в популярном эффекте, воспроизводит ошибку учёных, описывая каждый шаг, и наглядно демонстрирует причины, по которым эту ошибку не замечали более 15 лет

Читать на нашем сайте

Три графика разброса и линий тренда: шум, автокорреляция и скрытая автокорреляция, иллюстрация ошибки в анализе.
Графики из статьи Фикса, демонстрирующие, как автокорреляция создаёт видимую корреляцию между переменными.

Дискуссия

Teslak
залил в нейроночку с хорошими промптами статью с вики, критику и ответ на критику если кратко, то и сама статья на вики признаёт с оговорками тейки касательно плохой работы этого эффекта саммари и перевод нейронки:
1. Суть эффекта ДК (как он изначально представлялся, "сильный" эффект): Люди с низкой компетентностью в определённой области систематически и значительно переоценивают свои способности. Значительно – ключевое слово. Речь идёт о большом разрыве между реальной и воспринимаемой компетентностью. Эта переоценка в основном вызвана недостатком метакогнитивных способностей: некомпетентные люди "не знают, чего не знают", и поэтому не могут адекватно оценить свой уровень. Это главное объяснение в оригинальной работе. Люди с высокой компетентностью, наоборот, слегка недооценивают свои способности. Всё это наглядно демонстрируется классическим графиком ДК (с резко расходящимися линиями воспринимаемой и реальной способности). Этот график – главное визуальное доказательство. 2. Ключевые пункты критики ("сильного" эффекта ДК, в основном, по статье Фикса и другим работам): Автокорреляция: Оригинальный метод анализа (график ДК) содержит фундаментальную статистическую ошибку – автокорреляцию. Он сравнивает переменную (реальную способность) с выражением, которое её включает (воспринимаемая способность минус реальная способность). Это искусственно создаёт видимость сильного эффекта, даже при случайных данных. Это главный аргумент критики. Регрессия к среднему: Экстремально низкие (или высокие) результаты при повторном измерении (или самооценке) имеют тенденцию смещаться к среднему значению. Это вносит вклад в наблюдаемый паттерн, но не является основной причиной сильного эффекта. Шум в данных: Самооценка всегда содержит случайную ошибку (шум). Оригинальный метод не позволяет отличить реальный эффект (если он есть) от этого шума. Любое отклонение от идеальной самооценки будет выглядеть как эффект ДК на оригинальном графике. Альтернативные объяснения: Переоценка (если она существует сверх статистического артефакта) может быть вызвана множеством факторов, а не только метакогнитивными недостатками: эффект "выше среднего" (better-than-average effect), излишне позитивные предвзятые убеждения (prior beliefs), сложность самооценки для людей с очень близкими уровнями навыков, и т.д. Преувеличение величины эффекта: Ключевой пункт. Даже если какая-то тенденция к большей переоценке у некомпетентных и существует, её реальная величина, скорее всего, гораздо меньше, чем показывал оригинальный график ("сильный" эффект). 3. Позиция статьи Википедии (согласие и несогласие с критикой): Согласие с критикой (явное и неявное): Признание автокорреляции: Статья явно признаёт проблему автокорреляции и подробно описывает её суть в разделе "Statistical and better-than-average effect". Это ключевое достижение статьи и главное согласие с критикой. Статья понимает суть проблемы. Альтернативные объяснения: Статья представляет несколько альтернативных объяснений эффекта ДК (статистическое, рациональное, распределение уровней навыков), а не только метакогнитивное. Это явное согласие с тем, что оригинальное объяснение не является единственным и, вероятно, не главным. Разногласия о величине эффекта: Статья явно указывает на "разногласия о величине эффекта и его практических последствиях". Это важное признание, хотя и недостаточно чёткое (см. ниже). Распространённые заблуждения: Статья явно опровергает распространённые неверные интерпретации ДК (например, что "глупые люди считают себя умнее умных"). Упоминание регрессии к среднему: Статья явно упоминает регрессию к среднему как фактор, который необходимо учитывать при интерпретации результатов. Критика метакогнитивного объяснения: Статья явно упоминает, что метакогнитивное объяснение является спорным и имеет недостаточную эмпирическую поддержку. Упоминание работ критиков: Nuhfer et al., Gignac and Zajenkowski – статья ссылается на ключевые критические работы. Несогласие с критикой (или, скорее, неполное принятие критики / недостаточная чёткость):
Teslak
Статус "сильного" эффекта ДК: Статья не делает однозначного вывода, что сильный эффект ДК полностью является статистическим артефактом. Она представляет это как одну из основных интерпретаций, но всё же оставляет место для "слабого" эффекта ДК. Это главное расхождение с наиболее радикальной критикой. Акцент на "тенденции": Статья, хотя и признаёт проблемы с оригинальной формулировкой, продолжает говорить о "тенденции" людей с низкой компетентностью переоценивать свои способности. Она не переходит полностью на позицию "это в основном шум, а не систематическая тенденция". Недостаточное внимание к величине эффекта: Критически важно. Хотя статья упоминает разногласия о величине, она недостаточно чётко подчёркивает, что оригинальный сильный эффект, скорее всего, сильно преувеличен из-за автокорреляции. Она должна была бы явно сказать, что классический график ДК вводит в заблуждение относительно величины эффекта. Недостаточный акцент на необходимости новых исследований: Статья не делает достаточно сильного акцента на том, что необходимы новые исследования с использованием более строгих методов, чтобы доказать существование реального эффекта, отличного от статистического артефакта. Она упоминает альтернативные методы измерения, но не подчёркивает, что старые методы ненадёжны. Итоговый вывод (уточнённый): Статья Википедии представляет собой значительный шаг вперёд по сравнению с некритичным принятием сильного эффекта ДК. Она признаёт основные пункты критики, особенно проблему автокорреляции, и представляет альтернативные объяснения. Однако статья недостаточно решительна в полном принятии критики. Она: Согласна с критикой в том, что оригинальный метод анализа ("сильный" эффект ДК) ошибочен и что эффект, вероятно, преувеличен. Не согласна (или, по крайней мере, не полностью согласна) с тем, что сильного эффекта ДК вообще нет (что он полностью является статистическим артефактом). Она скорее занимает позицию "слабый эффект, возможно, существует, но он гораздо слабее и сложнее, чем считалось ранее, и не объясняется исключительно метакогнитивными проблемами". Ключевое различие между позицией статьи и позицией наиболее радикальных критиков – в статусе "сильного" эффекта. Статья Википедии его ослабляет, но не отвергает полностью. Критики же считают "сильный" эффект ДК полностью опровергнутым статистическими аргументами. Можно сказать, что статья Википедии отражает текущее состояние научного консенсуса: сомнения в "сильном" эффекте ДК очень велики, но полного отказа от возможности существования какого-то эффекта (более слабого и сложного) пока нет.
Teslak
Teslak
немного отойду в сторону: ты не сталкивался с миллионами сообщений, в которых люди, не разбирающиеся в вопросе, высказывают своё мнение о вакцинации, биологии, космосе, экономике, политике, эффекте ДК, статистике и многом другом? как иначе можно описать явление…
но некоторые комментаторы смешали претензии к матобоснованию ДК и его мысль, на что я и указал (видимо, эти претензии смешали и упомянутые желающие подтвердить эффект) произошла ирония с этим эффектом переоценки, когда комментаторы (возможно, без научной деятельности и знаний статистики), не понимая, о чём речь, должны получить в целом большую базу знаний касательно этого явления второй тейк реплея не только не опровергается критикой, а даже подтверждается
Люди часто ошибаются в оценке собственных знаний, умений, способностей и личных качеств. Это не специфическая особенность эффекта Даннинга-Крюгера (Dunning-Kruger effect, DK), а фундаментальное свойство человеческого познания, проявляющееся во множестве ситуаций и подтверждённое обширными исследованиями. Неточность самооценки – это скорее правило, чем исключение. Она может выражаться в переоценке, недооценке, неточной калибровке уверенности и искажённом представлении о себе. В популяционных исследованиях, где измеряется компетентность в некой области и самооценка этой компетентности, часто наблюдается, что в группе с низкой компетентностью по измеряемой области, самооценка имеет тенденцию к переоценке. Однако, следует помнить, что: Это статистическая тенденция, а не универсальный закон. Величина переоценки в среднем, вероятно, невелика, в сравнении с предсказаниями оригинальной статьи Даннинга-Крюгера. Переоценка не является единственным фактором, и зависит от множества других, в том числе и от сложности задачи, контекста, и когнитивных искажений. Вариативность самооценки в группе низкой компетентности выше, чем в группе высокой. Подтверждающие исследования: Неточность самооценки – не изолированный феномен, а следствие общих принципов работы человеческого познания и результат множества факторов. Это подтверждается исследованиями в следующих областях: Когнитивные искажения (Cognitive biases): Систематические ошибки мышления, многие из которых связаны с неточной самооценкой: Сверхуверенность (Overconfidence Effect): Переоценка точности собственных суждений, знаний и прогнозов. Подразумевает несовпадение самооценки с реальностью. Примеры работ: Tversky, A., & Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185(4157), 1124-1131.; Camerer, C. F., & Lovallo, D. (1999). Overconfidence and excess entry: An experimental approach. American Economic Review, 89(1), 306-318. Иллюзия контроля (Illusion of Control): Переоценка своей способности влиять на случайные события. Пример работы: Langer, E. J. (1975). The illusion of control. Journal of Personality and Social Psychology, 32(2), 311. Планировочное заблуждение (Planning Fallacy): Недооценка времени, необходимого для выполнения задач. Пример работы: Kahneman, D., & Tversky, A. (1979). Intuitive prediction: Biases and corrective procedures. TIMS Studies in Management Science, 12, 313-327. Предвзятость подтверждения (Confirmation Bias): Косвенно связана, так как люди ищут информацию, подтверждающую уже имеющиеся (и, возможно, неточные) представления о себе. Эффект "выше среднего" (Better-than-average Effect): Большинство людей считают, что они выше среднего по многим положительным качествам. Это прямое свидетельство неточности, так как статистически невозможно, чтобы большинство было выше среднего. Пример работы: Alicke, M. D., & Govorun, O. (2005). The better-than-average effect. In M. D. Alicke, D. A. Dunning, & J. I. Krueger (Eds.), The self in social judgment (pp. 85-106). Psychology Press. Исследования самосознания и самопознания (Self-awareness and Self-knowledge): Эти исследования напрямую изучают, насколько точно люди понимают себя. Они показывают, что самопознание ограничено и подвержено искажениям: "Self-insight: Roadblocks and detours on the path to knowing thyself" (Wilson & Dunn, 2005): Обзорная статья, систематически рассматривающая пределы самопознания. Авторы показывают, что люди часто не знают истинных причин своего поведения, неточно оценивают свои эмоции и переоценивают контроль над мыслями и поведением.
Teslak
Teslak
немного отойду в сторону: ты не сталкивался с миллионами сообщений, в которых люди, не разбирающиеся в вопросе, высказывают своё мнение о вакцинации, биологии, космосе, экономике, политике, эффекте ДК, статистике и многом другом? как иначе можно описать явление…
Ключевая цитата: "We argue that people often do not know the causes of their own responses... people often do not have privileged access to the causes of their behavior..." "Blind spots in the mind's eye: What metacognition research can learn from illusions" (Rahnev et al., 2017): Статья показывает, что метакогнитивные процессы (оценка уверенности в своих суждениях) подвержены тем же искажениям, что и сами суждения. Это подразумевает, что даже когда люди пытаются оценить свою точность, они могут ошибаться. Исследования отдельных аспектов: Работы, изучающие самооценку интеллекта, моральных качеств, физической привлекательности и т.д., часто показывают расхождение между самооценкой и объективными показателями или оценками других людей. Ошибки в метапознании (Metacognitive Miscalibration): Это не просто неточность самооценки, а неточная оценка собственной точности. То есть, человек не просто ошибается в своих знаниях, но и ошибается в оценке того, насколько он ошибается. Исследования показывают, что ошибки в метапознании распространены и влияют на обучение, принятие решений и поведение. Примеры работ: Hacker, D. J., Bol, L., Horgan, D. D., & Rakow, E. A. (2000). Test prediction and performance in a classroom context. Journal of Educational Psychology, 92(1), 160. Metcalfe, J. (1998). Cognitive optimism: Self-deception or memory-based processing heuristics?. Personality and Social Psychology Review, 2(2), 100-110. Исследования точности межличностного восприятия (Interpersonal Perception): Показывают, что люди не всегда точны не только в оценке себя, но и в оценке других. Это косвенно указывает на общие ограничения когнитивных процессов, связанных с оценкой и суждением. Примеры работ: Funder, D. C. (1995). On the accuracy of personality judgment: A realistic approach. Psychological Review, 102(4), 652.; Vazire, S. (2010). Who knows what about a person? The self–other knowledge asymmetry (SOKA) model. Journal of Personality and Social Psychology, 98(2), 281. Прикладные области: Неточность самооценки имеет практическое значение во многих сферах: Образование: Разрыв между самооценкой учащихся и их реальными результатами. Профессиональная деятельность: Влияние на карьерные решения, оценку рисков, принятие решений в условиях неопределённости. Клиническая психология: Искажённая самооценка как часть многих психологических проблем (депрессия, тревожные расстройства, расстройства личности). Критика эффекта Даннинга-Крюгера и позиция Блэра Фикса: Статья Блэра Фикса ("The Dunning-Kruger Effect is Autocorrelation") и другие критические работы неявно, но однозначно признают неточность самооценки как данность. Они не спорят с тем, что люди могут ошибаться. Их аргументы направлены против конкретного метода оригинального исследования ДК и выводов о систематической и значительной переоценке, вызванной исключительно метакогнитивными недостатками. Цитата 1 (с пояснением): "Subtracting y − x seems fine, until we realize... It means that we can throw random numbers into x and y... and yet... the effect will still emerge." Пояснение: Фикс моделирует ситуацию полного отсутствия связи между реальной способностью (x) и самооценкой (y), используя случайные числа. Он подразумевает, что в реальных данных самооценка (y) неидеальна и содержит случайную ошибку (шум). Именно наличие этой ошибки (неточности) делает автокорреляцию проблемой и создаёт иллюзию "сильного" эффекта ДК. Цитата 2 (с пояснением): "When we plot individuals' test score against their self assessment, the data appear completely random... people of all abilities are equally terrible at predicting their skill..." Пояснение: Это описание результата моделирования со случайными данными, а не утверждение о реальных данных. Фикс показывает, что оригинальный метод не различает отсутствие связи и наличие связи, замаскированной шумом. "Equally terrible" – гипербола, подчёркивающая проблему метода, а не полную неспособность людей к самооценке. Уточнённые выводы об эффекте Даннинга-Крюгера:
Teslak
Teslak
немного отойду в сторону: ты не сталкивался с миллионами сообщений, в которых люди, не разбирающиеся в вопросе, высказывают своё мнение о вакцинации, биологии, космосе, экономике, политике, эффекте ДК, статистике и многом другом? как иначе можно описать явление…
Критика эффекта ДК не отрицает возможность того, что люди с низкой компетентностью в определённой области могут быть более склонны к переоценке своих способностей, чем люди с высокой компетентностью. Однако она ставит под сомнение: Величину этого эффекта: Оригинальное исследование ("сильный" эффект ДК) предполагало большую и систематическую переоценку. Критика показывает, что эта величина сильно преувеличена из-за статистической ошибки (автокорреляции) и других факторов. Реальный эффект (если он есть), скорее всего, гораздо слабее. Исключительную роль метакогнитивных недостатков: Оригинальное исследование утверждало, что главная причина переоценки – это неспособность некомпетентных людей осознать свою некомпетентность. Критика показывает, что это объяснение не является единственным и, вероятно, не главным. На самооценку влияет множество факторов. Систематичность эффекта: Критика показывает, что наблюдаемый в оригинальном исследовании паттерн, в значительной степени, является результатом статистического артефакта и шума, а не систематической тенденции. Насколько верны выводы эффекта Даннинга-Крюгера: С учётом критики, выводы оригинального исследования ДК ("сильный" эффект) следует считать в значительной степени неверными или, по крайней мере, сильно преувеличенными. Систематическая и значительная переоценка: Утверждение о том, что люди с низкой компетентностью систематически и значительно переоценивают свои способности, не подтверждается при более строгом анализе. Наблюдаемый в оригинальном исследовании паттерн, в основном, является результатом статистической ошибки (автокорреляции) и влияния других факторов (регрессия к среднему, шум в данных). Исключительно метакогнитивное объяснение: Утверждение о том, что переоценка главным образом вызвана недостатком метакогнитивных способностей, не является единственным и, вероятно, не главным. На самооценку влияет множество факторов. Слабый эффект: Вероятно, существует некоторая тенденция к большей переоценке у людей с низким уровнем компетентности, но эта тенденция значительно слабее, чем предполагалось изначально, и не объясняется исключительно метакогнитивными проблемами. Классический график: Создаёт ложное впечатление. Итоговый вывод: Неточность самооценки — это подтверждённый факт. Однако конкретные выводы оригинального исследования эффекта Даннинга-Крюгера о систематической и значительной переоценке своих способностей людьми с низкой компетентностью, вызванной в основном недостатком метапознания ("сильный" эффект ДК), не выдерживают критики. Наблюдаемый паттерн, по большей части, является результатом статистического артефакта и влияния других факторов. Возможно, существует более слабый реальный эффект, но его величина и причины требуют дальнейшего изучения с использованием более строгих методов. Ошибки в метапознании (Metacognitive Miscalibration), то есть неточная оценка собственной точности, также являются распространённым явлением, вносящим вклад в общую неточность самооценки.
Alexander Kobets
цифровой самурай
в психологии «воспроизводится» — это не «один раз получилось, а потом ещё второй раз», это воспроизведение результатов в десятках, если не сотнях экспериментов. + мне лень читать лонгриды по ссылкам, если человек не способен тезисно пересказать то, что сам…
Дипсик или перплексити тебе в помощь А скинуть ссылку -- норм тема, тем более, что главный тезис статьи он написал)
Petr
Хорошая дискуссия, но кроме корневой статьи, никаких научных или около научных данных нет. Попное чувство данными не является и к критике конкретного метода расчёта имени ДК отношения не имеет. Автору спасибо за статью, репостну у себя. Для меня это хороший пример другого свойства человека: желанию все категоризировать относительно себя. А дальше мир пытаться запихать в выбранную категорию, даже если мии не хочет туда влезать. Очень мешает порой. А, впрочем, иногда помогает 😁
Присоединиться к обсуждению →

Читайте так же