Публикации по теме 'data-science'


Десятый четверг — 11-я неделя 2023 года
1. Легенда Unix Кен Томпсон объявляет о переходе с macOS на Raspbian Linux 13 марта 2023 г. Беседа Кена Томпсона 2. Очки с живыми субтитрами позволяют глухим людям читать разговоры 29 июля 2022 г. 3. Анализ вышедшего из строя сверла с помощью электронного микроскопа 18 марта 2023 г. Сегодня мы собираемся проанализировать дрель, которая сломалась на прошлой неделе во время сверления алюминия. Мы рассмотрим его под микроскопом, а затем воспользуемся помощью друга..

Октан данных определяет потенциал инноваций в области кибербезопасности
Октан данных определяет потенциал инноваций в области кибербезопасности Инновация — это процесс, который включает в себя очень разнообразный набор переменных, и только когда все они согласованы, он дает успешные результаты. Идентичность инновации всегда трансформируется во что-то другое, и из-за этого трудно экстраполировать рецепт от одного проекта к другому. Существуют десятки определений и попыток «структурировать» инновации, но, к сожалению, это редко работает на практике. Итак,..

Значение разреженности данных: раскрытие скрытых идей
Введение В эпоху информационного взрыва данные стали источником жизненной силы современного общества. Организации, предприятия и исследователи в значительной степени полагаются на данные для получения ценной информации, принятия обоснованных решений и внедрения инноваций. Однако не все данные одинаковы. Среди огромного моря информации возникает уникальное явление под названием «разреженность данных». Разреженность относится к ситуации, в которой значительная часть данных содержит пустые..

Видеть — значит верить: сила визуализации данных с помощью Python
В сегодняшнюю цифровую эпоху данные повсюду. От аналитики социальных сетей до финансовых отчетов данные играют решающую роль в нашей жизни. Однако необработанные данные могут быть громоздкими и трудными для понимания. Вот тут и приходит на помощь визуализация данных. Визуализация данных — это искусство представления сложных данных в простой для понимания и визуально привлекательной форме. В этой статье мы рассмотрим возможности визуализации данных с помощью Python, включая различные..

Единообразие данных в науке о данных
Решение наиболее распространенных проблем с однородностью в Pandas Введение В моих предыдущих статьях об очистке данных я говорил о том, что значения вне допустимого диапазона, неправильные типы данных, ограничения уникальности являются распространенными проблемами, и если оставить их нетронутыми, это может серьезно поставить под угрозу наш анализ. В этой статье мы рассмотрим не менее опасную проблему, которая может также исказить наш анализ, а именно единообразие единиц измерения..

Введение в K-кратную перекрестную проверку
Специалисты по данным используют метод перекрестной проверки, чтобы помочь оценить производительность модели, а также предотвратить ее переоснащение. Этот метод используется для настройки гиперпараметров моделей, которые напрямую влияют на то, насколько хорошо модель обучается. Гиперпараметры выбираются до обучения модели. Процесс поиска правильных гиперпараметров называется настройкой гиперпараметров или…

Машины опорных векторов — Обзор
Первоначально разработанная как модель для прогнозирования числовых и категориальных результатов, SVM сегодня используется в основном как метод классификации. Этот алгоритм идеально сочетает в себе три основные концепции науки о данных: информатику, статику и теорию оптимизации. Он похож на логистическую регрессию тем, что устанавливает границу для определения разделения между классифицированными данными. Однако основное различие заключается в том, как выбирается разделитель или..