Сярод усёй лухты, якую Беларускае тэлебачаньне вываліла на Незалежны інстытут сацыяльна-эканамічных і палітычных дасьледаваньняў, мяне, як усё ж кандыдата фіз.-мат. навук, асабліва павесялілі адкрыцьці дырэктара Інстытуту сацыялёгіі НАН РБ Ігара Катлярова. Павучаючы НІСЭПД, той заявіў: «Рэпрэзэнтатыўнае дасьледаваньне — апытаньне 2000-2500 чалавек».
У чалавека, які хоць трошкі разьбіраецца ў статыстыцы, гэта сьцьвярджэньне ня можа выклікаць нічога, акрамя рогату. Ігар Васільевіч — вялікі вучоны, але лічбаў яму лепш было б не дакранацца наогул. Ну не ягонае гэта.
Памятаю, у 90-х гадах ён неяк заявіў, што гранічная памылка рэпрэзэнтатыўнасьці нейкага дасьледаваньня кіраванага ім тады інстытуту — 0.3%, траціна адсотку. Дарэмна тады і Станіслаў Шушкевіч, які доктар фіз.-мат. навук, і я, грэшны, усяго толькі кандыдат, ведаючы матстатыстыку прынамсі на ўзроўні унівэрсытэцкага курсу, ветліва пераконвалі масьцітага сацыёляга, што для такой дакладнасьці дасьледаваньня трэба апытаць дзясяткі тысячаў чалавек. Але спадар Катляроў ўпарта стаяў на сваім.
Так і цяпер. Ну не разумее чалавек. Па жыцьці. Бывае.
Не хачу грузіць чытачоў дакладнымі формуламі, але насамрэч стандартная гранічная памылка рэпрэзэнтатыўнасьці ў сацыялягічных дасьледаваньнях — 3%. Якая цалкам забясьпечваецца выбаркай 1000-1500 чалавек. Выбаркай такога аб’ёму карыстаюцца Лявада-цэнтар, Gallup, Pew і іншыя сусьветна вядомыя сацыялягічныя цэнтры.
Уся рота сусьветнай сацыялёгіі крочыць не ў нагу, адзін таварыш прапаршчык Катляроў — у нагу.
Гэта значыць, што ўся рота сусьветнай сацыялёгіі крочыць не ў нагу, адзін таварыш прапаршчык Катляроў — у нагу. Не бяды — так і ёсьць, відаць.
Насамрэч залежнасьць памылкі рэпрэзэнтатыўнасьці ад аб’ёму выбаркі нелінейная, там залежнасьць у адпаведнасьці з квадратным коранем — каб атрымаць прынцыпова іншы ўзровень дакладнасьці, трэба апытваць ня 2000-2500 чалавек, як вучыць нас таварыш прапаршчык Катляроў, а 10000. Гэта ў разы павялічвае выдаткі на дасьледаваньне.
Калі ў апытаньні на паўтары тысячы чалавек атрымліваецца, што, скажам, рэйтынг Трампа 43%, а Клінтан — 45%, дык калі вельмі трэба і ёсьць грошы, то можна зрабіць дзесяцітысячнік, каб высьветліць, наколькі рэпрэзэнтатыўная гэтая розьніца. Апытаньне на паўтары тысячы чалавек сапраўды не дазваляе сказаць, наколькі значная гэтая розьніца ў 2 адсоткавыя пункты. Але ў пераважнай большасьці выпадкаў такое павелічэньне аб’ёму выбаркі проста ня мае сэнсу.
Як наогул ня мае сэнсу і тэза спадара Катлярова: «рэпрэзэнтатыўнае дасьледаваньне — апытаньне 2000-2500 чалавек». Пры якой памылцы рэпрэзэнтатыўнасьці? У прынцыпе рэпрэзэнтатыўнае і апытаньне аднаго чалавека, проста памылка рэпрэзэнтатыўнасьці вельмі вялікая. Пры прынятай у сацыялёгіі памылцы 3%, стандартны аб’ём — 1500 чалавек. Гэтак улюбёныя спадаром Катляровым 2000-2500 чалавек — як гаворыцца, ні два ні паўтара, дакладнасьць вышэй, чым пры стандартнай памылцы 3%, але ніжэй, чым пры зусім ужо ідэальнай — 1%. Ну і навошта?
Сваім нязграбным павучаньнем спадар Катляроў прадэманстраваў для кампэнтэнтных людзей, што проста ня цяміць у гэтым пытаньні. І рэч не ў ягоных палітычных перакананьнях. Любіць ён Аляксандра Рыгоравіча, як бацьку роднага — сьцяг яму ў рукі, сэрцу не загадаеш. Хоча прыводзіць зьвесткі апытаньняў, якія на карысьць прадмета яго любові — гэта крыху горай, але я не настаўнік маральнасьці, усе мы людзі, усе жыць хочуць, і Ігар Васільевіч у тым ліку.
Але навошта ж казаць відавочную лухту, якай ёсьць лухтой хоць з лібэральнага, хоць з лукашэнкаўскага, хоць зь якога іншага ідэалягічнага пункту гледжаньня?
Бяда гэтай публікі нават ня ў тым, што яна сэрвільныя, а ў тым, што яна абуральна некампэтэнтная.
Толькі ж у іх усё так. Ну ці ў нас — у нейкім сэнсе. І ня толькі ў аўтарытарызме рэч. Проста адзіны сапраўды таленавіты чалавек там — гэта сам Лукашэнка. А бяда большай часткі астатняй той публікі — нават ня ў тым, што яна сэрвільныя. А ў тым, што яна абуральна некампэтэнтная. У тым ліку і дырэктар Інстытуту сацыялёгіі НАН, які некампэтэнтны менавіта ў даручанай яго клопату сфэры.
PS. Для аматараў навуковай чысьціні. Формула гранічнай памылкі рэпрэзэнтатыўнасьці
u(1-a/2)/(2*sqrt (n)),
дзе
Sqrt — корань квадратны,
а — узровень значнасьці (звычайна ў сацдасьледаваньнях ён бярэцца 0.05 або 0.01)
U (1-a/2) — квантыль нармальнага разьмеркаваньня, адпаведны імавернасьці 1-а/2 (каб ня забіваць галаву u (0.975) = 1.96, u (0.995) = 2.576).
n — аб’ём выбаркі.
Адсюль, у прыватнасьці, зразумела, чаму звычайна ў апытаньнях апытваюць прыкладна 1000-1500 чалавек. Пры ўзроўні значнасьці а=0.05 і аб’ёме выбаркі n=1000 атрымліваем памылку рэпрэзэнтатыўнасьці — зададзеныя 3%.