Модель истории (инструкция по созданию) [черновик]

Андрей Степаненко
.
СРАЗУ — ОСНОВНОЕ
Свидетельство об историческом событии в норме должно содержать сведения:
— о месте события;
— о времени события (иногда с точностью до дня);
— о типе события (война, ураган, эмиссия банкнот и т.д.).
Для математической обработки исторических массивов и создания общей модели течения исторических процессов этого хватает, и существующая база данных (пусть и требующая пополнения и очистки от дубликатов) создать такую модель уже позволяет. Я покажу, как эту базу данных обрабатывать в Excel-2007, хотя подчеркну, что те же задачи решаемы и в массе иных программ.
.
ФАЙЛЫ ДЛЯ СКАЧИВАНИЯ
Модель истории 1 (Word) — повтор этого поста — 92 Кб — https://drive.google.com/file/d/1uIG6_9JIxW0IrDeMfYALR5F4Uzk5Z2Uo/view?usp=sharing
Модель истории 2_1 (Excel) — примеры на листах 01-16 — 15,9 Мб — https://drive.google.com/file/d/1a1GrogM7kuQ5fowk76MXZ_u_msRY1Bhn/view?usp=sharing
Модель истории 2_2 (Excel) — примеры на листах 17-29 — 25,5 Мб — https://drive.google.com/file/d/12xZlyX6bSuCLi10C4ZbLi524OpN2qHke/view?usp=sharing
Модель истории 3 (Excel) — примеры на листах 30-45 — 15,5 Мб — https://drive.google.com/file/d/1lpQZqU6hXSaIuaSKuhxIpxhI4uWOIVY0/view?usp=sharing
База данных (Excel) — 29,3 Мб — https://drive.google.com/file/d/1UfWe2Ezeauh1N93mMnj8HH8d6CRTg61K/view?usp=sharing

.

ОСНОВНЫЕ ЦЕЛИ
В данном случае у нас две цели:
1) Выделить пары событий разного типа, потенциально связанные, например, условное землетрясение на о. Хоккайдо и последовавшее за ним цунами на о. Хоккайдо или условную войну в Голштинии и гиперинфляцию в Голштинии. Если события разного типа происходят синхронно и совместно слишком уж часто, например, в 96 % случаев, мы нашли закономерность.
2) После установления закономерности определяем среднюю дату пары таких событий. Если речь идет о регулярно повторяющихся парах событий (например, о цунами после землетрясения), средняя дата нам ничего не даст, но если пара событий уникальна (например, освобождение крестьян из крепостной зависимости и следующая за этим эмиссия новых дензнаков), мы получаем надежную научную опору.
Подобных целей может быть много (не только эти две), но если мы знаем сам принцип обработки массива, их всех можно достичь.
.
БАЗА ДАННЫХ
В основе — база данных в Excel-2007. По состоянию на 01 января 2020 г. весит 29,3 Мб и содержит 156 тысяч датированных исторических свидетельств.
Название файла: 00_База_2020_01_01
.
СОДЕРЖАНИЕ БАЗЫ ДАННЫХ
Лист «База»
Столбец A. Год события
Столбец B. Историческое свидетельство (как правило, это цитата)
Столбец C. Нумерация основных видов событий:
1 – несортированные события
3 – наука и техника
4 – природные и гуманитарные катастрофы
5 – водные системы (каналы, в том числе)
9 – не определено
Столбец D. Части света.
Столбец E. Страна (в текущей классификации). Если страна неизвестна, стоит индекс «oq». Индексы стран разделены запятыми.
Столбец F. Агент, активная сторона. Обычно это завоеватель, инвестор или иное активное руководство, обычно вмешивающееся в жизнь иного территориального образования.
Столбец G. Регион. Регион «Северная Африка» содержит несколько небольших стран, а регионы «Западная Сибирь и «Восточная Сибирь» — части одной страны.
Столбец H. Штат. Это обычно часть страны, например, штат Айова, Липецкая область, Саксония-Анхальт.
Столбец I. Город. Если указан в свидетельстве. Городов бывает несколько. Если города из разных штатов или стран, это должно отражаться в соответствующих столбцах.
Столбец J. № 2 дня (ст.стиль). Порядковый номер дня события по старому стилю.
Столбец K. № 1 дня. Порядковый номер дня года. 1 января – 1, а 31 декабря – 365. Високосные даты не учитываются. 48,4 % от общего числа строк в базе.
Столбец L. Номер месяца. Здесь же указывается сезон, например, «лето», которому присвоен свой номер. 48,4 % от общего числа строк в базе.
Столбец M. Номер дня в месяце (от 1 до 31). 40,8 % от общего числа строк в базе.
Столбец N. Оригинал. Текст свидетельства на языке оригинала (22 %).
Столбец O. Источник свидетельства. Поскольку не все оригиналы источников есть в сети, указываю тот источник, что нашел (78 %).
Столбец P. Имя. Обычно это имя крупной исторической личности, например, Тамерлан (4,7 %).
Столбец Q. Цифровое значение, встречающееся в тексте свидетельства, например, количество погибших.
Столбец R. Единица измерения данных предыдущего столбца, например, «погибших» или «рублей».
Столбец S. Обозначение типа топонима (вулкан, водоем) в столбце T.
Столбец T. Топоним, в частности, приведены все названия упомянутых в базе вулканов.
Столбец U. Индекс типа события, например, ураганы, войны, смена столицы.
Столбец V. Служебный столбец, необходимый для оптового добавления новых индексов типа события.
Столбец W. Долгота места события, например, цунами.
Столбец X. Широта места события.
Столбец Y. Высота события над уровнем моря, в частности, для цунами, но может быть использована и шире.
Столбец Z и далее – служебные столбцы, помогающие отбирать отсортированные события.
.
Лист «Легенда».
Столбец A. Индекс типа события без запятой.
Столбец B. Индекс типа события с запятой.
Столбец C. Тип события.
Столбец D. Надгруппа над несколькими типами родственных событий.
.
Лист «Дни»
Столбец A. День года.
Столбец B. Порядковый номер дня в году.
Отдельно – порядковые номера для месяцев года и сезонов года.
.
Лист «Страны». 
Столбец A. Индекс места без запятой.
Столбец C. Расшифровка индекса места (наименование территории)
Столбец H. Статус территории (страна, регион, штат и т.д.)
.
Лист «Шаблон».
Рабочий лист, созданный для сокращения хронологии. На данном этапе он не нужен.
.
РАБОЧИЙ ФАЙЛ
Название файла: Модель истории 2
Файл Excel-2007 предназначен, чтобы давать примеры порядка обработки информации. Сам порядок будет описан здесь, в этом файле.
Чтобы рабочий файл не был слишком уж тяжелым, взял из базы данных свидетельства с 1401 по 1699 год включительно (около 20 тысяч строк) и столбцы с A по U.
.
ТЕКУЩАЯ ЦЕЛЬ
Следует получить датированные с точностью до года индексы места и индексы типа события. Тройка индексов «год-место-тип» должны быть очищены от дубликатов, например, условный «ураган в Туле в 1535 году» может встречаться в добром десятке свидетельств, но нам требуется только одно.
.
ПОРЯДОК ОБРАБОТКИ
На листе «01» вставляем 20621 свидетельство из базы данных с 1401 по 1699 год.
На листе «02» вставляем лист «Легенда» с расшифровкой индексов типа события.
На листе «03» вставляем лист «Страны» с расшифровкой индексов места.
На листе «04» повторяем данные с листа «01» и удаляем ненужные в данном случае столбцы. Оставляем только те данные, что нужны для этой модели: год, страна, регион, штат, тип события.
.
ОТСТУПЛЕНИЕ
Полезная и пригодная для обработки информация есть и в иных столбцах, например, номер дня года (столбец K), Агент (столбец F); можно обработать и цифровые данные (столбец Q), и географические координаты, и высоту цунами, но принцип обработки одинаков для всех видов информации.
.
ПОРЯДОК ОБРАБОТКИ
Поскольку в одном году и в одном месте регулярно происходят события нескольких типов, их следует разделить. Выделяем столбец «Индекс», входим в опцию «Данные», затем в опцию «Текст по столбцам», оставляем галочку на «с разделителями», нажимаем «Далее», ставим галочку на «запятая», нажимаем «Далее», нажимаем «Готово». Запятая между индексами одной ячейки выполняет функцию разделителя, и индексы разбегаются по столбцам. Результат смотрим на листе «05». Оставляем курсор на верхней строке, нажимаем опцию «Фильтр», сохраняем файл и выходим из программы, чтобы, на всякий случай убрать опцию разделения по запятым.
.
ФИЛЬТР
Опять открываем файл, в столбце Q фильтром убираем галочку с опции «Пустые» и жмем ОК. Строка с непустой ячейкой тут же появится. Копируем непустую ячейку в столбце Q и вставляем ее внизу столбца E (Индекс). Затем копируем выделенные серым цветом ячейки столбцов с датой и индексами места и вставляем их ниже – в ячейки болотного цвета. После этого столбец Q удаляем за ненадобностью.
Затем фильтром выбираем непустые ячейки столбца P. Здесь уже два индекса, берем и переносим в столбец «Индекс» их оба. Копируем выделенные серым цветом участок и вставляем их напротив перенесенных индексов.
.
Смысл операции: придать каждому индексу типа события отдельные положенные ему дату и индексы места.
.
Число индексов, требующих переноса, будет постоянно расти, и однажды копировать станет неудобно. Тогда открываем два «Блокнота» и копируем левые четыре столбца с датой и индексами места в один «Блокнот», а требующие переноса индексы типа события – во второй «Блокнот». Спускаемся вниз, поочередно копируем и переносим массивы из Блокнота в Эксель, удаляем строку с заголовками, удаляем откопированный столбец справа. Образец на листе «06»: перенос этого этапа уже состоялся, и требуется удалить строку с заголовками, а затем крайний справа (уже перенесенный) столбец.
.
Если Вы обрабатываете всю базу целиком, на каком-то этапе Экселю при копировании станет не хватать памяти (он сообщит). Не обращайте внимания, просто вставляйте откопированное в Блокноты – откопированное там непременно появится. Вообще, во всех случаях, когда Экселю при копировании массива не хватает памяти, забивайте откопированное в Блокнот, — ему памяти хватает всегда.
.
Когда с лишними столбцами с индексами места будет покончено, перенесите готовый столбец «Индекс» поближе к дате (чтоб не мешал) (пример на листе «07») и повторите тот же ряд операций со следующим крайним справа столбцом. Затем – со следующим.
.
Если в процессе запятые начнут исчезать, а группы индексов произвольно дробиться, Вы забыли перед этим выйти и войти, чтобы снять опцию деления запятыми.
.
В итоге часа через 3-4 у Вас должны получиться 5 колонок с одним индексом в каждой. Образец на листе «08».
.
РАБОТА С ИНДЕКСАМИ МЕСТА
На этом этапе нам нужны максимально точные индексы места. Поэтому, если указан штат, то должен стоять именно индекс штата, а не страны или региона. Устанавливаем фильтр и в столбце «Штат» отжимаем галочку на «Пустые». В столбце «Страна» пишем формулу, уравнивающую ячейку в столбце «Страна» с аналогичной ячейкой в столбце «Штат». Тащим курсором вниз, потом отжимаем фильтр, копируем столбец «Страна» и снова вставляем его «Специальной вставкой», опция «Значения». В результате вместо формулы заменятся на индексы. После этого столбец «Штат» можно удалять.
.
В тех случаях, когда ни страны, ни штата нет, надо ставить индекс региона. Для этого фильтром оставляем в столбце «Страна» только значение «Пустые» и формулой приравниваем пустую ячейку столбца «Страна» к ячейке столбца «Регион» и тащим курсором вниз. Смотрите на листе «09».
.
Затем отжимаем фильтр, копируем столбец «Страна» и специальной вставкой вставляем «значения».
.
ТОНКОСТЬ С РЕГИОНАМИ
В четырех странах – России, США, Канаде и Китае – регулярна ситуация, когда штата в свидетельстве не указано, а регион указан, у примеру «Квебек», «Урал» или «Поволжье». Если мы хотим точности, следует оставить эти регионы. Для этого ставим фильтр, в столбце «Страна» отжимаем все индексы и выделяем только ca, cn, ru, us, а в столбце «Регион» убираем галочку с «Пустые». В результате в столбце «Регион» остаются только нужные нам индексы регионов. Формулой приравниваем верхнюю ячейку столбца «Страна» к параллельной ячейке в столбце «Регион» и тащим курсором вниз. Пример на листе «09-2». Часто индексы одинаковы (что не страшно), но индекс zk (Закавказье) уже заместил собой индекс ru (Россия), и это намного точнее.
.
После этого столбец «Регион» можно удалять. Затем через фильтр ищем и удаляем строки, где есть пустые ячейки или ячейки, равные «0». Результат на листе «10».
.
УДАЛЕНИЕ ДУБЛИКАТОВ
Дубликаты, когда данные повторяются во всех трех итоговых столбцах, неизбежны. Копируем все три столбца и вставляем их в «Блокнот». Копируем в Блокноте интервал между столбцами, выбираем опцию «Заменить», вставляем откопированный интервал в строку «Что», а в строке «Чем» пишем знак доллара. Нажимаем «Заменить все». Выделяем и копируем результат и вставляем его на лист «11».
.
Входим в опцию «Вставка», выбираем «Сводная таблица», жмем, перетаскиваем заголовок из верхнего окошка в два нижних (названия строк и значения) и получаем сводную таблицу, где в левом столбце комплексные индексы, а в правом – количество повторов (лист «12»). Копируем левый столбец и специальной вставкой (опция «Значения») вставляем его на лист «13».
.
РАЗДЕЛЕНИЕ СТОЛБЦА
Выделяем столбец, в опции «Данные» выбираем «Текст по столбцам», выбираем опцию «с разделителями», жмем «Далее», ставим галочку на «Другой», забиваем знак доллара, жмем «Далее» и «Готово». На листе «14» у нас готовый результат: 35 тысяч строк без единого дубликата. В самом низу убираем текстовый остаток от сводной таблицы. Подготовительная цель достигнута.
.
ОЦЕНИВАЕМ ИНДЕКСЫ ТИПА СОБЫТИЯ
Забиваем формулу ВПР на листе «15» и получаем расшифровку индексов типа события, — те, что у нас расположены на листе «02» (Легенда). Это необходимо, чтобы увидеть те индексы, что нам не нужны и подлежат удалению. Определенно не нужны служебные индексы, работающие только в паре: рх (основание), ою (запрет), оя (первый).
.
Здесь же, той же формулой можно выбрать события только из тех надгрупп (столбец «Надгруппы»), что хочется оценить, например, имеющие отношение к экономике.
.
Проделаю операцию замены формулы на значения (через специальную вставку) и удаления ненужного на листе «16». Для удаления ставим фильтр, оставляем галочку только на ненужном индексе и удаляем те строки, что выпали.
.
Можно поступить иначе: выбрать фильтрами то, что нужно, откопировать выборку, а затем вставить на следующем листе. Я в данном случае (лист «17») уберу три выше перечисленных индекса и следующие Надгруппы.
— индустрия
— инфраструктура
— наука и техника
— обобщающий индекс
— оборудование
— средства связи
— примечания
— товары
— элементы (химические)
Такое удаление помогает не чересчур тонуть в информации.
.
ВЫЧИСЛЕНИЕ ПРОЦЕНТА СОВПАДЕНИЙ
Пара событий разных типов хороша тем, что может ясно указать на закономерность. Удаляем с листа «17» Расшифровку и Надгруппы, меняем столбцы «Индекс» и «Страна» местами и через знак доллара объединяем год и индекс места. Вместо трех столбцов получаем два.
.
Если объединение не выходит, то Вы забыли выйти из программы и снова зайти в нее после функции разделения.
.
Выделяем эти два столбца и через опцию «Вставка» проходим в опцию «Сводная таблица». Жмем. Получаем лист «18».
«Год$Страна» перетаскиваем в название строк.
«Индекс» перетаскиваем в название столбцов.
И еще раз перетаскиваем «Индекс» в значения.
Выделяем полученную таблицу, копируем и специальной вставкой вставляем значения на следующий лист «19».
.
Полную базу (150 тысяч строк) у меня опция «Сводная таблица» не тянет, поэтому делю обрабатываемые массив на четыре части, и прогоняю поочередно. Чтобы индексы после переноса в сводную таблицу совпадали по расположению, намеренно ввожу фальшивую вставку, например, под годом 1400 (которого здесь нет), а затем четырежды его удаляю уже из сводной таблицы. Пример такой фальшивой вставки на листе «17-2».
.
В столбце слева у нас годо-регионы, первым сверху стоит 1401 год в Рейнальд-Пфальц. Если мы пройдем в правый край таблицы, то увидим количество индексов типа события в этой строке. Можно сразу фильтром выбрать все значения «1» и смело эти строки удалять, поскольку в этом году и в этом месте парных событий разного типа совершенно точно нет. Однако, я их не удаляю, поскольку буду еще вычислять процент совпадений, и для этого желательна полная картина.
.
СОЗДАНИЕ ФОРМУЛЫ
На листе «20» я создам формулу для вычисления числа совпадений для каждой пары индексов. Вот как она выглядит в общем:
формула =СУММЕСЛИ(B2:B5; «Иван»; C2:C5) суммирует только те значения из диапазона C2:C5, для которых соответствующие значения из диапазона B2:B5 равны «Иван».
.
Однако сначала нам нужен шаблон буквенного ряда листа Экселя – точно по числу индексов типов событий (их здесь 463). Для этого на листе «19» я протащил формулу вида «=B11869) через весь лист, а затем опцией «Найти и выделить» заменил знак «=» на пустоту. Смотреть внизу таблицы на листе «19».
.
Затем я откопировал весь ряд значений в строке (то, что красным) и вставил на листе «20» специальной вставкой с опцией «Транспонировать». Ряд повернулся на 90 градусов, а я получил нужные мне шаблоны.
.
В столбце «M» на листе «20» — черновик формулы, которую мы вставляем внизу таблицы на листе «21». После вставки заменяем в выделенном массиве «СУММ» на «=СУММ), и формула начинает работать. Осталось только протащить весь этот выделенный участок вправо до конца таблицы. Результат переносим на лист «22». Перед нами число совпадений (в одном году в одном месте) пар индексов разных типов.
.
ВЫЧИСЛЕНИЕ ПРОЦЕНТА
Число совпадений индексов левого столбца и верхней строки составляет определенный процент от числа индексов в базе всего. Разницы, что с чем соизмерять, нет, а потому будем считать процент от числа индексов в левом столбце. Чтобы узнать число индексов в массиве, выделяем столбец «Индексы» на листе «17», в опции «Вставка» щелкаем на опцию «Сводная таблица» и перетаскиваем заголовок «Индексы» на поле «названия строк», а затем на поле «Значения». Результат — на листе «23». Выделяем столбец с количеством, копируем и специальной вставкой «Значения» вставляем, например, справа от столбца с индексами на листе «22».
.
ВЫЧИСЛЕНИЕ ПРОЦЕНТА
Копируем таблицу с листа «22» на лист «24» и забиваем формулу, — смотрите прямо на листе «24». Протягиваем формулу по всей таблице. Процент совпадений индексов столбца с индексом строки (не наоборот!) вычислен.
.
ПОИСК ТОЧКИ ПЕРЕГИБА
Следует определиться, какой процент совпадений считать найденной закономерностью. Для этого переношу данные таблицы на лист «25» и кусками (деля массивы пополам) переношу данные 463 столбцов в один столбец. Это нудно, однако необходимо. Оставляю на листе «25» незавершенную работу, чтобы было ясно, как это выглядит. Готовый результат на листе «26».
.
Загоняем ряд в сводную таблицу и получаем данные, сколько у нас каждого вида значения. Лист «27». 87 % сочетаний индексов совпадений не имеет. Среди 737 сочетаний, имеющих 100 % совпадений 463 – совпадение индекса с самим собой.
.
Создаю график и убираю крайние значений. Резкие взлеты возникают у тех индексов, что малы числом, например, 2 совпадения из 3 это 67 %, и такого много. Это не плохо, это нормально.
.
В данном случае перегиб графика (когда он уходит вверх) виден в районе 5 %, и это свойство малых массивов, если считать всю базу целиком, перегиб будет в районе 22 %. Поэтому поступим жестко: совпадения со значением менее 22 % считаем случайными, а не закономерными.
.
ВЫВЕДЕНИЕ ЗАКОНОМЕРНЫХ СОЧЕТАНИЙ НА ЛИСТ
Копируем таблицу с листа «24» на лист «28». С помощью формулы «ЕСЛИ» оставляем на листе лишь те значения, что более 21,999. Таких значений здесь порядка 1600. На листе «29» заменяем «N» на пустую ячейку. Цель достигнута.
.
ОТСТУПЛЕНИЕ
Поскольку далее программа зависает из-за тяжести файла, продолжение следует в файле «Модель истории 3». Нумерация листов продолжается с № 30.
.
ВЫЧИСЛЕНИЕ СРЕДНЕЙ ДАТЫ ПАР СОБЫТИЙ
Сразу создаем формулу на листе «30». Шаблон сходный.
Переносим лист «21» на лист «31», однако, обычным копированием это делать не стоит: на листе 214 тысяч формул, и программа повиснет, поэтому копируем в Блокнот, а уже оттуда – на лист «31».
.
В правой колонке нам необходима только дата, поэтому отдельно делим столбец с разделителем в виде знака доллара (уже обкатано), копируем и возвращаем в столбец A только дату.
.
Переносим черновик формулы в столбце (лист «30») на лист «31». Затем заменяем «СРЗНАЧ» на «=СРЗНАЧ», и формула начинает работать. Протягиваем формулу по всей таблице и ждем, когда пересчитает, возможно до нескольких минут.
.
Переносим полученную таблицу на лист «32» — специальной вставкой, только значения, без формул. Заменяем #ДЕЛ/0! На пустую ячейку. Средние даты для каждого сочетания индексов готовы.
.
Однако нам нужны только те средние даты, которым отвечает совпадение пар индексов типов событий в 22 % и более. Для этого со страницы «29» предыдущего файла переносим на лист «33» этого файла таблицу процентов.
.
СОПОСТАВЛЕНИЕ ДВУХ ТАБЛИЦ
На листе «34» вставляем шаблонную таблицу (например, с листа «33»).
Забиваем формулу, по которой сюда будут переноситься средние даты с листа «32», но только в том случае, если отвечающие им ячейки на листе «33» будут непустыми. В ином случае будет забиваться буква N. Протягиваем ячейку с формулой по всей таблице.
.
Результат (только значения, без формул) переносим на лист «35». Удаляем букву N.
.
УДАЛЕНИЕ ЗНАКОВ ПОСЛЕ ЗАПЯТОЙ
Средние даты имеют по 4-8 знаков после запятой, и это нам в массиве из 300 лет ни к чему. Оставляем только целое число. Для этого выделяем значения, уменьшаем разрядность, копируем и вставляем все это в Блокнот, выделяем все, снова копируем и возвращаем в Эксель.
.
СОЗДАНИЕ ИТОГОВОГО СВОДА
Теперь нам необходимо выбрать отдельно несколько показателей.
— дату
— сравниваемый индекс
— процент совпадений
— тот индекс, с которым сравнивают
Для этого на листе «36» создаем формулу для склеивания нужных нам данных. Выглядит она так:
=’35’!C2&»$»&’35’!$B2&»$»&’35’!C$1&»$»&’33’!C2
Смотрите лист. Все получилось.
.
УДАЛЕНИЕ ЛИШНЕГО
Нам требуется удалить содержимое ячеек с 7 символами. Поэтому на листе «38» подсчитываем число символом в ячейках на листе «37». А на листе «39» оставляем только те значения листа «37», у которых на листе «38» более 7 символов. Сохраняем полученное на листе «40», удаляем буквы N, удаляем крайнюю верхнюю строку и крайний левый столбец, и выделяем полученное поле значений.
.
СБОРКА ДАННЫХ В ОДНО МЕСТО
Выделив поле со значениями, нажимаем F5.
Опция «Выделить», опция «пустые ячейки», «ОК».
Правой клавишей мышки, находим опцию «удалить», выбираем №Пустые ячейки, затем ставим галочку на «со сдвигом влево». ОК.
.
ЕЩЕ РАЗ, НО ИНАЧЕ
Найдем границы поля и на листе «41» повторим операцию удаления пустых ячеек, но со сдвигом вверх. И вот теперь все это можно собрать в один столбик вручную, что мы и проделаем на листе «42».
.
Здесь видна ошибка: в процентах тоже следовало уменьшить разрядность до целых значений. Впрочем, это исправимо.
.
На листе «42» — готовый результат после разделения индексов и сокращения разрядности в столбце «Процент». Это и есть финальная цель: мы отобрали закономерные совпадения событий разного типа в одном месте и в одно время, и у нас есть средняя дата для каждой пары таких событий. И это уже модель.
.
ВЫБОРКА
Здесь 2442 строки, и в этом можно утонуть. Поэтому на листе «44» выберем только то, что в первом (сравниваемом) индексе относится к экономике.
Вижу 59 повторов, что не фатально, однако является технической ошибкой, — где-то дубликаты не вымарались. Возможно, дело в запоздалом изменении разрядности: одинаковые группы данных были учтены Экселем, как разные.
.
Однако с этим уже можно работать, и, в частности, видать, что:
— эмиссия денежных знаков связана с Крестовыми походами и кредитованием
— ипотека связана с благочестивыми банками
— Общество с ограниченной ответственностью связано с Фуггерами. Это – жестокий анахронизм, однако в истории семьи Фуггеров так и написано: было создано общество с объявленным уставным капиталом, — более чем за 300 лет до того, как в Британии были придуманы сами эти юридические принципы.
.
Если последовательность традиционных дат не ложна, должно просматриваться и развитие экономических событий.
.
ПОЛНАЯ ВЕРСИЯ
Полная версия, с которой я начал работать, размещена на листе «45». В ней данных больше. Но сразу предупреждаю, поскольку данных больше, средняя дата парных событий иная.
.
ПЕРСПЕКТИВЫ
Я показал сам принцип – примитивный, но безоговорочно научный. Теперь каждый, потратив пару дней, может сам обработать прилагаемую и свободно скачиваемую базу данных и прийти к своим собственным выводам.
.
База данных определенно требует улучшения, но, как известно, улучшения не кончаются никогда. Здесь каждый сам решает, что важно, а что вторично, что требует улучшения, а что – сноса.
.
Лично для меня наиболее перспективным является путь сокращения хронологии примерно в 20 раз, что приведет к появлению и удалению массы дубликатов, но в итоге связи между событиями разного типа станут заметно яснее и логичнее.

С пожеланиями успехов,
Андрей Степаненко
03 января 2020 года.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *