Аказваецца, магчыма атрымаць матэматычна строгі і незалежны ад асабістых схільнасьцяў дасьледніка адказ на гэтае пытаньне. Трэба толькі прааналізаваць як мага большую колькасьці кніг, напісаных аўтарамі ХІХ стагодзьдзя, на прадмет іх стылю і тэматыкі.
Колькі кніг трэба прааналізаваць дасьледчыку, каб прыйсьці да нейкай больш-менш аўтарытэтнай высновы наконт уплывовасьці ў літаратуры — 50, 100, 200? У кожным выпадку, гэта праца на доўгія гады, калі не дзесяцігодзьдзі.
А вось кампутары, калі іх загрузіць адпаведнай праграмай статыстычнага аналізу словаў, могуць прааналізаваць значна больш кніг і ў значна карацейшым часе, чым чалавек.
Мэт’ю Джокерз, літаратуразнаўца з Унівэрсытэту штату Нэбраска, выкарыстаў кампутары для статыстычнага аналізу стылю і тэмаў у амаль 3600 кнігах, выдадзеных у 1780-1900 гг.
Вынік, атрыманы прафэсарам Джокерзам, быў даволі нечаканы. Аказваецца, ня Чарлз Дыкенс, ня Томас Гарды і ня Герман Мэлвіл з Маркам Твэнам былі найважнейшымі ангельскамоўнымі пісьменьнікамі для сваіх калегаў-сучасьнікаў.
Паводле кампутарнага аналізу Мэт’ю Джокерза, найбольш уплывовымі ангельскамоўнымі пісьменьнікамі ХІХ стагодзьдзя былі Джэйн Остын (аўтарка, сярод іншага, «Пыхі і перадузятасьці») і Вальтэр Скот (аўтар гістарычных раманаў, напрыклад «Айвэнга»).
«Традыцыйна гісторыю літаратуры пісалі на аснове вывучэньня адносна невялікай колькасьці тэкстаў. Гэтая тэхналёгія дазваляе вам убачыць вялікую карціну — кантэкст, у якім працаваў пісьменьнік — у маштабе, які ня быў даступны раней,» — сказаў Джокэрз пра свой досьлед выданьню New York Times.
Джокерз, які вывучаў ангельскую філялёгію ва ўнівэрсытэце, самастойна навучыўся праграмаваньню кампутараў і статыстычным мэтадам аналізу. Ягоныя матэматычныя мадэлі, якія ён выкарыстоўвае ў аналізе сувязяў паміж літаратурнымі тэкстамі, шмат у чым нагадваюць альгарытмы, якія ўжываюцца пошукавай сыстэмай Google.
Статыстычныя мэтады аналізу ў гуманітарных і грамадзкіх навуках пры выкарыстаньні вялікай колькасьці дадзеных і з дапамогай кампутараў усё пашыраюцца, спараджаючы новую тэрміналёгію. Такім чынам, колькасны аналіз у паліталёгіі сёньня называецца «палітычнай мэтадалёгіяй», у гісторыі — «кліямэтрыяй», у літаратуры — «стылямэтрыяй». Агулам, колькасны аналіз у гуманітарных і грамадзкіх навуках называецца «культуромікай».
Адной з самых прыдатных крыніц тэкстаў для статыстычных досьледаў рознага роду зьяўляецца віртуальнае сховішча кнігаў пад назвай Google Books, у якім магчыма правесьці кампутарны пошук сярод 20 мільёнаў адсканаваных кнігаў.
У 2011 годзе група дасьледчыкаў з Гарвардзкага ўнівэрсытэту, пры дапамозе пошуку ў Google Books, правяла досьлед тэмы, як хутка забываецца мінулае, заключанае ў кніжках. Дасьледчыкі аналізавалі спасылкі да канкрэтных гадоў, якія зьмяшчаліся ў кніжках, што захоўваюцца ў электроннай бібліятэцы Google Books. Для прыкладу, колькасьць спасылак на «1880», пік якіх прыпадаў якраз на гэты год, паменшала ўдвая ў 1912 годзе, гэта значыць, праз 32 гады. А вось колькасьць спасылак на «1973» паменшала ўдвая ўжо ў 1983 годзе, гэта значыць, праз 10 гадоў. «Мы забываем сваё мінулае штораз хутчэй з кожным наступным годам» — напісалі дасьледчыкі ў высновах са свае працы.
Колькі кніг трэба прааналізаваць дасьледчыку, каб прыйсьці да нейкай больш-менш аўтарытэтнай высновы наконт уплывовасьці ў літаратуры — 50, 100, 200? У кожным выпадку, гэта праца на доўгія гады, калі не дзесяцігодзьдзі.
А вось кампутары, калі іх загрузіць адпаведнай праграмай статыстычнага аналізу словаў, могуць прааналізаваць значна больш кніг і ў значна карацейшым часе, чым чалавек.
Мэт’ю Джокерз, літаратуразнаўца з Унівэрсытэту штату Нэбраска, выкарыстаў кампутары для статыстычнага аналізу стылю і тэмаў у амаль 3600 кнігах, выдадзеных у 1780-1900 гг.
Вынік, атрыманы прафэсарам Джокерзам, быў даволі нечаканы. Аказваецца, ня Чарлз Дыкенс, ня Томас Гарды і ня Герман Мэлвіл з Маркам Твэнам былі найважнейшымі ангельскамоўнымі пісьменьнікамі для сваіх калегаў-сучасьнікаў.
Паводле кампутарнага аналізу Мэт’ю Джокерза, найбольш уплывовымі ангельскамоўнымі пісьменьнікамі ХІХ стагодзьдзя былі Джэйн Остын (аўтарка, сярод іншага, «Пыхі і перадузятасьці») і Вальтэр Скот (аўтар гістарычных раманаў, напрыклад «Айвэнга»).
«Традыцыйна гісторыю літаратуры пісалі на аснове вывучэньня адносна невялікай колькасьці тэкстаў. Гэтая тэхналёгія дазваляе вам убачыць вялікую карціну — кантэкст, у якім працаваў пісьменьнік — у маштабе, які ня быў даступны раней,» — сказаў Джокэрз пра свой досьлед выданьню New York Times.
Джокерз, які вывучаў ангельскую філялёгію ва ўнівэрсытэце, самастойна навучыўся праграмаваньню кампутараў і статыстычным мэтадам аналізу. Ягоныя матэматычныя мадэлі, якія ён выкарыстоўвае ў аналізе сувязяў паміж літаратурнымі тэкстамі, шмат у чым нагадваюць альгарытмы, якія ўжываюцца пошукавай сыстэмай Google.
Статыстычныя мэтады аналізу ў гуманітарных і грамадзкіх навуках пры выкарыстаньні вялікай колькасьці дадзеных і з дапамогай кампутараў усё пашыраюцца, спараджаючы новую тэрміналёгію. Такім чынам, колькасны аналіз у паліталёгіі сёньня называецца «палітычнай мэтадалёгіяй», у гісторыі — «кліямэтрыяй», у літаратуры — «стылямэтрыяй». Агулам, колькасны аналіз у гуманітарных і грамадзкіх навуках называецца «культуромікай».
Адной з самых прыдатных крыніц тэкстаў для статыстычных досьледаў рознага роду зьяўляецца віртуальнае сховішча кнігаў пад назвай Google Books, у якім магчыма правесьці кампутарны пошук сярод 20 мільёнаў адсканаваных кнігаў.
У 2011 годзе група дасьледчыкаў з Гарвардзкага ўнівэрсытэту, пры дапамозе пошуку ў Google Books, правяла досьлед тэмы, як хутка забываецца мінулае, заключанае ў кніжках. Дасьледчыкі аналізавалі спасылкі да канкрэтных гадоў, якія зьмяшчаліся ў кніжках, што захоўваюцца ў электроннай бібліятэцы Google Books. Для прыкладу, колькасьць спасылак на «1880», пік якіх прыпадаў якраз на гэты год, паменшала ўдвая ў 1912 годзе, гэта значыць, праз 32 гады. А вось колькасьць спасылак на «1973» паменшала ўдвая ўжо ў 1983 годзе, гэта значыць, праз 10 гадоў. «Мы забываем сваё мінулае штораз хутчэй з кожным наступным годам» — напісалі дасьледчыкі ў высновах са свае працы.