?

Log in

No account? Create an account
Корбулону и Чурову посвящается - Maxim Pshenichnikov — LiveJournal
August 31st, 2013
06:30 pm

[Link]

Previous Entry Share Next Entry
Корбулону и Чурову посвящается
new-1
На рисунке показана доля результатов, кратных 5$, цены неважно-чего в многочисленных опросах. Единственный математически корректный результат - примерно 20% - был получен из полностью фальсифицированных данных (работа Smeesters et al. была позже отозвана). Симонсон этим рисунком разоблачил фальсификатора-социолога, поскольку тот в своей "статистике" использовал генератор случайных чисел, который давал математически-корректный результат, но который совершенно немыслим, если бы ответы давали живые люди.

Источник: U. Simonsohn, "Just Post it: The Lesson from Two Cases of Fabricated Data Detected by Statistics Alone" (in press).

(11 comments | Leave a comment)

Comments
 
[User Picture]
From:corbulon
Date:August 31st, 2013 05:05 pm (UTC)
(Link)
[User Picture]
From:oude_rus
Date:August 31st, 2013 06:48 pm (UTC)
(Link)
кстати, по этому делу дофига психологических статей, довольно интересных.

Edited at 2013-08-31 06:49 pm (UTC)
[User Picture]
From:corbulon
Date:August 31st, 2013 07:07 pm (UTC)
(Link)
Это понятно, что до фига. Только подходит мало, если заниматься не психологией, а выборами.
У меня самый большой поток - 30 чел. Было бы хоть 500 - можно было бы отмоделировать составление протокола УИК, даже не упоминая слово "выборы".
[User Picture]
From:miroshka
Date:August 31st, 2013 05:10 pm (UTC)
(Link)
Я что-то понять не могу, почему это 20% - математически корректный результат. Что ли [..1, ..2, ..3, ..4, ..5]?

Речь ведь не о статистике бросков монеты. Контекст опросов общественного мнения предполагает округление, причем тем более частое, чем выше цена. Ответ типа "билет на самолет стоит $249" - если он действительно стоил $249 - может дать только человек с психическими отклонениями, а таковых в популяции не более 5%.
[User Picture]
From:oude_rus
Date:August 31st, 2013 06:45 pm (UTC)
(Link)
Именно. Если числа чисто-случайны, то вероятность кратности пяти будет 20%. Если она не 20%, значит, человек приложил шаловливые рученки. Ведь с т.з. математики, цена в 251 ничем не лучше 250.

Прикол же в этой картинке заключается в том, что Симонсон этим рисунком разоблачил фальсификатора, поскольку тот в своей "статистике" использовал генератор случайных чисел, который дал математически-корректный результат, но который немыслим, если бы ответы давали живые люди.
[User Picture]
From:miroshka
Date:August 31st, 2013 07:05 pm (UTC)
(Link)
Это да, прикольно.
From:(Anonymous)
Date:August 31st, 2013 07:42 pm (UTC)
(Link)
Тут надо уточнять, какие именно опросы имеются в виду. И для неважно-чего не всегда сработает. Например: устроить опрос, сколько в СССР стоила водка. Сколько будет ответов, кратных 5 (копеек)?

Африканец
[User Picture]
From:oude_rus
Date:August 31st, 2013 09:22 pm (UTC)
(Link)
кстати, да.
[User Picture]
From:faargenwelsh
Date:August 31st, 2013 10:11 pm (UTC)
(Link)
насчет водки, так это смотря кому вопрос задавать. если людям младше тридцати, то пропорция ответов, кратных пяти, вполне может быть соотносима с большинством тех, кторые указаны в графике.

я тоже пытался придумать экперимент, в котором это не сработало бы, но так ничего однозначного и не придумал - разве что заранее вводить ограничения на ответы (скажем, все они должны быть разными).

кстати, было бы интерестно сделать серию опросов об оценке чего-то стоимостью заведомо меньше первых сомножителей пятерки (типа 5, 10, 15, ...) - по одному отдельному опросу на каждый предмет. интересно, как менялась бы пропорция ответов, кратных пяти, с возрастанием стоимости.

Edited at 2013-08-31 10:12 pm (UTC)
From:a_kruglov
Date:September 1st, 2013 05:01 am (UTC)
(Link)
Это оттого, что люди знают правильный ответ, а не оценивают. Если спрашивать тех, кто не знает, будет больше. А если спрашивать какой сейчас год (когда он не кратен 5), результат будет в районе 0%.
[User Picture]
From:jemmybutton
Date:September 1st, 2013 05:51 am (UTC)
(Link)
Еще и интерфейс может иметь значение: если ответ дают, скажем, с помошью плавно движущегося бегунка на экране, то результат, вероятно, будет отличаться от записанного со слов.
Powered by LiveJournal.com