http://chri-soc.narod.ru/o_chisle_novomuchenikov.htm О числе новомучеников РПЦ в XX в.
Сомин Н.В. (ПСТГУ) somin@post.ru
Введение
В истории номоучеников и исповедников российских XX века остается недостаточно выясненным вопрос общего числа репрессированных православных. А вопрос этот крайне важен, поскольку достаточно точная оценка общего числа репрессированных позволит объективно представить масштабы гонений. Информация от официальных источников по этому поводу отсутствует. Поэтому сделанные до сих пор оценки [1] производились на основании косвенных соображений, отталкиваясь от общего числа священников (и монахов) в дореволюционной России и экспертных оценок. Такой подход не дает приемлемой точности.
Однако в последнее время благодаря усилиям сотрудников ПСТГУ под руководством проф. Н.Е. Емельянова была накоплена представительная база данных о новомучениках российских [2], содержащая сейчас более 35000 персон – православных клириков и активных мирян, повергшихся гонениям и содержащихся в местах заключения. Эта база позволяет провести более точные оценки общего числа репрессированных православных верующих, основанные на статистике процента уже имеющихся в базе персон при вводе новой информации.
Методика подсчета
Обозначим через N искомое общее число репрессированных верующих, а через Nb – общее число персон в базе новомучеников. Обычно ввод новой информации в базу производится в виде списков, поступающих от различных источников. При этом производится проверка: имеется ли персона из списка уже находящейся в базе, или это новая персона, для которой необходимо заводить новую запись. Это одна из важнейших фаз ввода, устраняющая дублирование информации. Отметим, что персоны, которые попали в базу дважды администраторы базы называют «двойниками» и тщательно вычищают.
Было замечено, что при вводе списков процент двойников хотя и колеблется в довольно широких пределах, но в среднем варьирует вокруг определенного числа. Это число может служить основанием для подсчета N. Если обозначить число элементов списка ввода через K, а число двойников в том списке через Kb, то при соблюдении определенных условий имеет место соотношение:
Nb/N = Kb/K.
Отсюда оценка общего числа новомучеников:
N=Nb*K/Kb. (1)
Условия, при которых соотношение с достаточной степень точности выполняется, можно свести к двум:
1) Независимость. Это означает, что процесс формирования списка не должен использовать информацию из базы данных, а осуществляться из других, независимых т базы, источников.
2) Представительность. Список должен содержать достаточное число персон – несколько тысяч. Иначе точность оценки будет неприемлемо низкой.
Суть соотношения (1) и условий 1)-2) состоит в том, что независимая выборка обладает свойством содержать такой же процент двойников в базе, как и процент всех персон в базе по отношению к общему количеству персон. Это свойство давно было замечено и оно используется социологами в методах оценки результатов выборов. Только там по Kb/K (выборка) ищется Nb/N – оценка процента голосования по всей совокупности избирателей. В нашем же случае то же соотношение (1) используется для расчета N по известным (или программно вычисляемым) Kb, K и Nb.
Сочетание обоих условий 1)-2) – достаточно редкое явление, поскольку подавляющее большинство вводимых списков достаточно коротки (не выполняется представительность) и зачастую являются дублями уже введенных списков (не выполняется независимость). Поэтому долгое время соотношение (1) было неприменимо. Наконец, в 2004 г. администрация базы получила в распоряжение большую базу данных по репрессированным, созданную обществом «Мемориал» [3]. Из этой базы специально разработанными программами был извлечен список репрессированных верующих, подавляющее большинство их которых было православными христианами. Этот список удовлетворял обоим сформулированным условиям. Действительно, он значителен по объему (тысячи позиций) и составлялся по совершенно другим источникам, чем списки, предоставляемые из епархий. Поэтому было решено использовать его для подсчетов по формуле (1). Подсчет числа двойников осуществлялся с помощью специально написанной программы, которая учитывала ФИО и год рождения.
Следует отметить, что по данной методике мы оцениваем число репрессированных, о которых мы в принципе можем получить информацию (ибо база данных может содержать лишь то, о чем в обществе сохранилась память). Этой методикой невозможно учесть новомучеников, о которых ничего не известно, например, в период гражданской войны. Однако в последующие периоды (когда число новомучеников было наибольшим) репрессии, как известно, были хорошо документированы. И потому обстоятельство отсутствия информации о некоторых новомучениках не может радикально изменить данную оценку.
Результаты подсчетов
Список Мемориала для удобства работы разбит на 19 файлов – с oq0.dcm до oqi.dcm. Для вычисления погрешности метода было проведено несколько экспериментов с базой данных по состоянию н середину 2014 г. и различными частями полного списка разной длины. Результаты экспериментов сведены в Таблицу 1.
Номер эксперимента Nb (число элементов в базе данных) K (число элементов списка ввода) Используемые файлы для списка Kb (число обнаруженных двойников) N (общее число новомучеников)
1 35275 9793 oq8-oqi 3228 107016
2 35275 2879 oq8-oqa 1050 97325
3 35275 1896 oqb-oqc 652 102578
4 35275 2959 oqd-oqf 1131 92195
5 35275 2160 oqg-oqi 596 127842
Таблица 1. Результаты экспериментов по сопоставлению базы данных новомучеников и списка ввода «Мемориал».
Обсуждение экспериментов и оценка погрешности метода
Число репрессированных, получаемое по всему списку ввода представлено в 1 строке Таблицы 1 и равно 107016. Для оценки погрешности метода был применена следующая методика: весь материал был разделен на четыре части так, чтобы файлы каждой из частей не пересекались и с каждой из частей были проведены расчеты числа двойников. Это позволяет строки 2-5 рассматривать как реализации случайной величины N, распределенной по нормальному закону (число реализаций n=4). Отсюда может быть рассчитано среднее отклонение «сигма» s и максимальная оценка погрешности метода по правилу «трех сигм».
.
Среднее арифметическое выборок равно: Nc= 104985.
Среднеквадратическое отклонение «сигма»: s= = 13697.
Отсюда «три сигмы»: 3s= 41091.
Максимальное значение числа новомучеников равно Nc+3s= 146086.
Возможна еще систематическая ошибка, обусловленная неточностью программной идентификации двойников. Выборочный ручной анализ списка двойников (около 300 случаев) показал, что программа ошибается не более чем в 3% случаев. Отсюда систематическая ошибка средней величины Nc может быть оценена не более, чем в 3000-3500 чел., что не может качественно изменить общую оценку метода.
Таким образом, можно сделать вывод, что согласно данному методу общая численность репрессированных православных верующих – около 100000 чел. ± 40%. Эта оценка в 5-6 раз меньше опубликованной в [1].
Литература
1. Емельянов Н.Е. К вопросу о числе новомучеников и исповедников Русской Православной Церкви в ХХ веке // Материалы 15-й Ежегодной Богословской конференции ПСТГУ / М. Изд-во ПСТГУ. 2005 г. Том 1. С. 265 — 271
2. База данных по новомученикам российским.
http://www.pstbi.ru/bin/code.exe/frames/m/ind_oem.html/charset/ans 3. База данных о жертвах политического террора в СССР. Компакт-диск. 3-е изд. НИПЦ "Мемориал". М.:Звенья, 2004.
28.09.14