Сообщения

Сообщения за ноябрь, 2024

РЕГРЕССИОННЫЙ АНАЛИЗ С ЛИНЕЙНОЙ ПРОЕКЦИЕЙ И МОДЕЛЬЮ SVM

Изображение
РЕГРЕССИОННЫЙ АНАЛИЗ С ЛИНЕЙНОЙ ПРОЕКЦИЕЙ И МОДЕЛЬЮ SVM Для сравнения я взял текст, посвященный ценникам на различные продукты. Форк по схеме: Polynomial Regression. Вывод: Чем дальше год, тем выше цены, однако в 2020 году цены в несколько раз ниже, чем в 1997, и на Сахар, и на Картофель.  Linear Projection Вывод: Судя по распределению данных, Сахар был дороже Картофеля в одинаковое время.  Scatter Plot. Вывод: Судя по общей модели данных с трендом регрессий в 1993 и 1994 Картофель был дороже Сахара, однако почти везде, во все годы, Сахар дороже Картофеля.  ИТОГ: Группа данных, которые я сравнивал, связаны. Я считаю, что  Linear Projection  более понятная визуально, однако  Scatter Plot более точная в своих данных и дает более точную оценку.   

Современные технологии поиска и обработки информации. Практическое задание №9. Структурный анализ информации из внешней базы данных

Изображение
  МФЖ-101. Современные технологии поиска и обработки информации. Практическое задание №9. Структурный анализ информации из внешней базы данных В "The Guardian" я вбил исполнителя "Eminem", т.к. в последние месяцы он отметился в СМИ своим скандальным альбомом и различными политическими высказываниями. Всего программа выдала 40 текстов на заданную тему. MDS а) В этой схеме есть два ключевых облака: зеленое и оранжевое. Первое связанно с музыкой, программа нашла отдельные статьи, которые не связаны между собой. Оранжевое облако - тема политики, которую затрагивал исполнитель. Также есть отдельные островки тем спорта или кино, где цитируется творчество рэпера. б) Очевидно, что входе выборов президента в США, журналисты прикрепляли комментарии селебрити, разбирали их или просто придавали огласке. Поэтому в оранжевом облаке все заголовки связаны между собой. Eminem в этот период выступил в штате Мичиган с экс-президентом США Бараком Обамой, чтобы вместе поддержать кандида...