Пересказ статьи RaviTeja G. Advanced Pandas: A Comprehensive Handbook for Data Enthusiasts
Это вторая часть нашего руководства по науке о данных с Pandas. В
части 1 мы заложили основы изучения структур данных, загрузки данных, очистки, выборки, индексации и манипуляции данными. Однако исследование данных на этом не заканчивается, правильно?
Теперь, во второй части, мы рассмотрим более продвинутые темы агрегации данных, анализа, визуализации, обработки данных временных рядов и другие.
Продолжить чтение "Продвинутый Pandas: исчерпывающее руководство для энтузиастов данных"
Пересказ статьи Henrietta Dombrovskaya. What Is an Execution Plan and How to Find It in PostgreSQL
В последнем блоге (
Когда настройка параметра в PostgreSQL не помогает) мы сравнили несколько планов выполнения для оператора SQL по мере изменения параметров и индексов. При этом не было упомянуто то, что собой представляет план выполнения, как можно получить план выполнения запроса и как интерпретировать результат. В этом блоге мы глубже погрузимся в эту тему.
Продолжить чтение "Что такое план выполнения и как его найти в PostgreSQL"
Пересказ статьи Rahma Hassan. Understanding the “ROWS BETWEEN” Clause in SQL
В SQL предложение “ROWS BETWEEN” является мощным средством, которое позволяет вам определить окно строк для анализа или вычислений непосредственно в запросе. Указывая диапазон строк, вы можете выполнять вычисления или применять агрегатные функции к подмножеству данных, а не ко всему результирующему набору. Цель данной статьи - сделать понятным предложение “ROWS BETWEEN” и его использование на примерах.
Продолжить чтение "Понимание предложения ROWS BETWEEN в SQL"
Пересказ статьи Tirendaz AI. Working with Text Data in Pandas
Реальные наборы данных состоят не только из чисел, они также включают текст. При анализе данных важно уметь работать с этим текстом.
В этой статье я собираюсь поговорить на следующие темы:
- Как использовать методы работы со строками в Pandas?
- Как использовать регулярные выражения в Pandas?
- Примеры работы с набором данных IMDb
Продолжить чтение "Работа с текстовыми данными в Pandas"
Пересказ статьи Andy Warren. Restore With Standby; A Review and A Lesson Learned
Имеются функции SQL Server, которые я использую часто и считаю, что понимаю их достаточно хорошо. Есть функции, о которых я знаю, но использую редко, и есть большой список вещей, на которые я только взглянул или использовал один раз. В части знакомых мне вещей я иногда обнаруживаю, что не вполне их понимал или пропустил темные углы, поскольку мне никогда не требовалось исследовать их. Хотя возникает огорчение или фейспалм Пикарда — естественные реакции на "Я думал, что знаю это", лучше осознать, что теперь у меня на один пробел меньше, чем было раньше. Здесь, как вы, вероятно, предположили, я имею в виду восстановление в режиме ожидания. Я начну с краткого обзора резервирования журнала, norecovery и standby, затем покажу вам как это работает на нескольких примерах, включая тот, который иллюстрирует урок, который я при этом получил, и сопровожу его некоторыми замечаниями о том, почему эта мелочь в восстановлении может однажды избавить вас от плохого настроения.
Продолжить чтение "Восстановление в режиме ожидания; обзор и выученный урок"
Пересказ статьи Daniel Calbimonte. Different ways to Convert a SQL INT Value into a String Value
Здесь я покажу различные способы преобразования данных в SQL Server из целого типа в строковый с помощью разных операторов SQL.
Начинаем
Пусть у нас есть числовой столбец OrderQty в таблице WorkOrder в производственной базе данных SQL.
SELECT [OrderQty]
FROM [Production].[WorkOrder]
Продолжить чтение "Различные способы преобразования целого значения в строку"
Пересказ статьи Robert Sheldon. Working with MySQL constraints
MySQL предоставляет набор ограничений, которые вы можете включить в определения ваших таблиц для обеспечения целостности данных. Ограничения позволяют лучше контролировать типы данных, которые могут быть добавлены в базу данных. Например, вы можете использовать ограничения, чтобы установить уникальность столбца или допустимость NULL-значений, указать значение по умолчанию для столбца или проверить, что данные попадают в определенный интервал допустимых значений.
MySQL поддерживает шесть основных типов ограничений для обеспечения целостности данных: PRIMARY KEY, NOT NULL, DEFAULT, CHECK, UNIQUE и FOREIGN KEY. В этой статье я познакомлю вас с каждым типом и рассмотрю примеры их работы. Примеры включают ряд операторов CREATE TABLE, которые демонстрируют различные способы встраивания ограничений в определения таблиц. Если вы не знакомы с оператором CREATE TABLE или с тем, как создавать таблицы в базе данных MySQL, обратитесь к моей
более ранней статье этой серии.
Продолжить чтение "Работа с ограничениями в MySQL"
Пересказ статьи Mehdi Ghapanvari. SQL Server Execution Plan Issues when using TOP Clause and Various Parameters
Запрос иногда оказывается супер быстрым, а иногда - очень медленным. Одной из основных причин такого поведения является прослушивание параметра (Parameter Sniffing). Имеется несколько подходов, связанных с проблемой прослушивания параметра, и в этой статье обсуждаются эффективные методы для обработки Parameter Sniffing в операторах SELECT, содержащих предложение TOP.
Продолжить чтение "Проблемы плана выполнения SQL Server при использовании предложения TOP и различных параметров"
Пересказ статьи Muhammad Mustafa. How to Boost Your Data Analysis: A Guide to Effective Data Cleaning with Python
В эру больших данных на бизнес и разработчиков обрушиваются огромные объемы информации. При этом данные зачастую далеко не идеальны и требуют значительной подготовки, прежде чем они смогут использоваться для анализа. Очистка данных - это обнаружение и исправление ошибок, несогласованности и неточности в наборах данных, чтобы гарантировать качество данных. Python с его богатой экосистемой библиотек предлагает мощные инструменты для эффективной очистки и подготовки данных для анализа. В этой статье мы рассмотрим различные методы и библиотеки Python, которые могут помочь вам привести ваши данные в порядок.
Продолжить чтение "Как улучшить анализ данных: эффективная чистка данных с помощью Python"
Пересказ статьи Andrei Rogalenko. NULL in Oracle
Ключевые моменты
Специальное значение NULL означает отсутствие данных, утверждение того факта, что значение неизвестно. По умолчанию столбцы и переменные любого типа могут принимать это значение, если они не имеют ограничения NOT NULL. Помимо этого, СУБД автоматически добавляет ограничение NOT NULL для столбцов, входящих в первичный ключ таблицы.
Главная особенность NULL состоит в том, что оно ничему не равно, даже другому NULL. Вы не можете сравнивать с ним любое значение с помощью операторов: =, <, >, like ... Даже выражение NULL != NULL не будет истинным, поскольку нельзя однозначно сравнивать одно неизвестное значение с другим. К слову, это выражение не будет и ложным (false), т.к. при вычислении условий Oracle не ограничивается состояниями TRUE и FALSE. Благодаря наличию элемента неопределенности в виде NULL, имеется еще одно состояние - UNKNOWN.
Продолжить чтение "NULL в Oracle"
Пересказ статьи Erland Sommarskog. Arrays and Lists in SQL Server. The Short Version
1. Введение
Эта сокращенная статья ориентирована на читателей, имеющих ограниченный опыт в программировании в SQL Server, в которой обсуждается как обрабатывать список значений, разделенный запятыми или каким-нибудь другим разделителем.
Полная версии статьи включает много других способов разбиение списков на таблицы - и вам будет о чем поспорить. Эта длинная статья предназначена для несколько более опытной аудитории. Скорее всего, сокращенная статья даст вам то, что требуется, но в некоторых местах я ссылаюсь на длинную статью для пользователей с особыми потребностями.
Продолжить чтение "Массивы и списки в SQL Server. Сокращенная версия"
Пересказ статьи Haq Nawaz. How to Connect & Query SQL Server using Python
Сегодня я расскажу, как подключиться к базам данных SQL, используя Python. Это распространенный вопрос, который возникает в
серии ETL. Поэтому я решил рассмотреть его и направлять посетителей сюда, если у них возникнут проблемы с подключением.
Эта установка SQL Server позволит нам:
- Установить подключение к базе данных SQL Server из Python
- Выполнять запросы к базе данных SQL Server
- Извлекать и сохранять данные в фрейме данных
Продолжить чтение "Как, используя Python, подключиться к SQL Server и выполнить запрос"
Пересказ статьи Tirendaz AI. Practical Data Analysis with Pandas
Реально существующие данные - "грязные". Они требуют предварительной очистки, чтобы осуществлять их анализ. Pandas является наиболее часто используемой библиотекой Python для очистки данных. В то же время Pandas является очень мощной библиотекой для анализа данных. В этой статье я покажу вам, как анализировать данные с помощью Pandas на реальном наборе данных.
Продолжить чтение "Практический анализ данных с Pandas"