К основному контенту

Сообщения

Сообщения за август, 2012

Вычислительная реализация рангового метода кластеризации

Кластеризация - это разбиение множества объектов на классы, в каждом из которых объекты похожи друг на друга. Каждый объект описывается некоторым набором признаков x 1 , x 2 , ..., x n . Каждому объекту ставится в соответствие точка в n -мерном признаковом пространстве. Обычно в кластер-анализе выбирается метрика, которая характеризует меру сходства двух объектов (расстояние между соответствующими точками), и применяется некоторый алгоритм кластеризации, который позволяет разбить объекты на кластеры.  В статье [1] был предложен так называемый ранговый метод кластеризации одномерных эмпирических данных. В этом методе не используется метрика. Имеются исходные эмпирические данные - набор положительных чисел w i ( i = 1, 2, ..., n ). Эти числа упорядочиваются по возрастанию, и каждому значению w ставится в соответствие порядковый номер - ранг r . Данные анализируются с помощью соотношения которое представляет собой модифицированный В.П. Масловым закон Ципфа (в [1] принято N =

Обобщённый алгоритм Грэхема для вычисления минимаксной регрессии с учётом аномальных точек

Вначале рассмотрим задачу вычисления минимаксной регрессии без аномальных точек. Рассмотрим набор точек плоскости ( x i , y i ) . Минимаксной регрессией называется прямая y = kx + b , минимизирующая наибольшее отклонение точек ( x i , y i ) от прямой, то есть это такая прямая y = kx + b , для которой функция     достигает минимума.

Генерация случайных чисел в Паскале и C++

При решении задач имитационного моделирования возникает необходимость генерации случайного числа. Иногда нужно сгенерировать случайное целое число в некотором диапазоне a ... b , а иногда — случайное действительное число в некотором диапазоне. (Обычно нужно, чтобы вероятностное распределение случайного числа было равномерным.)