или
Заказать новую работу(фрагменты работы)
Учебное заведение: | Восточно-Казахстанский технический университет имени Даулета Серикбаева |
Тип работы: | Бизнес план |
Категория: | Информационные технологии |
Год сдачи: | 2021 |
Количество страниц: | 11 |
Оценка: | 5 |
Дата публикации: | 01.03.2024 |
Количество просмотров: | 13 |
Рейтинг работы: |
Дисциплина: "Экспертные и интеллектуальные системы"
Оценка - 5
Работа сдавалась в 2021г.
«АНАЛИТИЧЕСКАЯ ПЛАТФОРМА DEDUCTOR. КЛАСТЕРИЗАЦИЯ, КЛАССИФИКАЦИЯ»
(фрагменты работы)
ОТЧЕТ
Кластеризации и классификации данных автомобилей.
1. Рассмотрим реализацию в Deductor. Импортируем в программу данные из файла «База1.txt» (рисунок 1).
2. Проводим кластеризацию методом g-means, следуя мастеру обработки данных.
Столбец Car – значение информационное. Для начала попробуем провести кластеризацию автомобилей, встроенными методами кластеризации g-means, k-means. Отличие кластеризации k-means от g- means в том, что если количество кластеров известно, то применяется алгоритм k-means, в противном случае g-means, который определит это количество автоматически в рамках заданного интервала. Сначала выполним кластеризацию методом g-means, т.е. не будем указывать количество кластеров, на которое необходимо разделить данную выборку
На рисунке 2 видно (визуализатор «Профили кластеров»), что алгоритм g-means выделил семь кластеров, но кластеры неравномерные (26,1%, 20,2%, 18,0%, 16,3%, 9,1%, 6,9%, 3,4%). С помощью этого визуализатора можно также увидеть значимость признаков (полей) при разбиении на кластеры.
Визуализатор «Что-если» позволяет провести эксперимент, введя любые значения признаков (полей). Если же нажать кнопку «Загрузить данные» из исходной выборки (рисунок 3), то можно заметить неточности определения кластеров из-за схожих признаков.
3.Проводим кластеризацию методом k-means, следуя мастеру обработки данных.
Выполним кластеризацию методом k-means. Укажем фиксированное количество кластеров – 7 (рисунок 4). На рисунке 6 приведен результат в визуализаторе «Профили кластеров». Выделено 7 кластеров, значения немного изменились (26,4%, 20,2%, 16,0%, 11,6%, 10,3%, 7,9%, 7,6%).
Работы автора