В первый год реализации проекта изучалось моделирование изменения содержания органического вещества, в почвах пашни представленного в виде бинарной переменной. Эта бинарная переменная принимает два количественных значения − 0 и 1. Значение 0 трактуется как слабое (низкое) изменение содержания органического вещества. Значение 1 трактуется как сильное (высокое) изменение содержания органического вещества. В легендах карт, приведенных в приложении, значения бинарной переменной подписаны этими качественными значениями.
Для бинаризации с помощью кластерного анализа применялись функции из дополнительного пакета cluster языка программирования R. Была выполнена бинаризация с помощью классификации k-средних, разделения вокруг медоидов (PAM – partition around medoids), нечеткой классификации c-средних (fuzzy c-means) и метод естественных границ Дженкса. Все эти методы дали идентичный результат бинаризации (рис. 1Б) – 7 районов попали в низшую категорию бинарной переменной и 14 районов − в высшую категорию бинарной переменной (рис. 1Б). Анализ результатов этих способов бинаризации показал, что порог разделения оказался в промежутке между 0,17 и 0,27.
Рисунок 1 – Изменение содержания гумуса в почвах пашни Белгородской области за период последних трех туров агрохимического обследования: A – исходные данные, Б – данные бинаризованные с помощью кластерного анализа; В – вероятность принадлежности к классу высоких значений, рассчитанная на основе ансамбля моделей для данных бинаризованных с помощью кластерного анализа; Г – точные и ошибочные предсказания для ансамбля моделей для данных бинаризованных с помощью кластерного анализа
Собинформ, текст и рисунок предоставил Украинский П.А.