Skip to content

Учебник по SQL Server и Python

Пересказ статьи Daniel Calbimonte. SQL Server and Python Tutorial


Введение


В этой статье мы рассмотрим подключение к SQL Server в Python с помощью библиотеки pyodbc. Если вы являетесь администратором базы данных SQL, то мы настоятельно рекомендуем выполнение скриптов Python в SSMS.

Однако некоторые Python-разработчики предпочитают работать непосредственно с Python, а не в SSMS с включением скриптов. Мы рассмотрим следующие темы: Continue reading "Учебник по SQL Server и Python"

Ранжирование в Python и SQL

Пересказ статьи Nathan Rosidi. Ranking in Python and SQL


Мы обсуждали основы ранжирования в Python в нашем руководстве “Methods for Ranking in Pandas”, где рассматривались наиболее употребимые параметры функции ранжирования в Pandas. В частности, мы изучали различные методы ранжирования, которые имеют решающее значение в борьбе с родственными значениями. Помимо методов ранжирования функция ранжирования в Pandas обладает и другими параметрами, которые позволяют выполнить дальнейшую настройку и уточнение способа определения рангов. Понимание этих параметров важно при работе с наборами данных, которые требуют более таких сложных методов ранжирования, как процентильное ранжирование или работа с недостающими данными.

Continue reading "Ранжирование в Python и SQL"

Упражнение Pandas для специалистов по данным — часть 2

Пересказ статьи Avi Chawla. Pandas Exercise for Data Scientists — Part 2


Библиотека Pandas всегда привлекала специалистов по данным своими изумительными возможностями. Она несомненно является важным инструментом для обработки и манипуляции данными.

Поэтому для расширения ваших экспертных знаний и знакомства с огромным числом популярных среди специалистов по данным функций Pandas я представляю вторую часть "Упражнение Pandas". Первую часть вы можете найти по ссылке.
Continue reading "Упражнение Pandas для специалистов по данным — часть 2"

Возможности функции Crosstab в Pandas для анализа и визуализации данных

Пересказ статьи R. Gupta. The Power of Crosstab Function in Pandas for Data Analysis and Visualization


Pandas является популярной библиотекой Python для анализа и манипуляции данными. Она предоставляет мощные инструменты для работы с табличными данными, включая такие структуры как ряды и фреймы данных, и функции для очистки, слияния и изменения формы данных.

Одним из наиболее полезных инструментов для анализа табличных данных в Pandas является функция crosstab(). Эта функция позволяет вам рассчитать таблицу частот двух и более переменных, которые суммируют разбросанные в данных значения и позволяют выявить связь между переменными. Перекрестная табуляция (или crosstab) является важным инструментом для анализа двух категориальных переменных в наборе данных. Она дает сводную таблицу распределения частот двух переменных, позволяя увидеть взаимосвязь между ними и идентифицировать любые шаблоны или тренды. Continue reading "Возможности функции Crosstab в Pandas для анализа и визуализации данных"

Продвинутый Pandas: исчерпывающее руководство для энтузиастов данных

Пересказ статьи RaviTeja G. Advanced Pandas: A Comprehensive Handbook for Data Enthusiasts


Это вторая часть нашего руководства по науке о данных с Pandas. В части 1 мы заложили основы изучения структур данных, загрузки данных, очистки, выборки, индексации и манипуляции данными. Однако исследование данных на этом не заканчивается, правильно?

Теперь, во второй части, мы рассмотрим более продвинутые темы агрегации данных, анализа, визуализации, обработки данных временных рядов и другие. Continue reading "Продвинутый Pandas: исчерпывающее руководство для энтузиастов данных"

Работа с текстовыми данными в Pandas

Пересказ статьи Tirendaz AI. Working with Text Data in Pandas


Реальные наборы данных состоят не только из чисел, они также включают текст. При анализе данных важно уметь работать с этим текстом.
В этой статье я собираюсь поговорить на следующие темы:

  • Как использовать методы работы со строками в Pandas?

  • Как использовать регулярные выражения в Pandas?

  • Примеры работы с набором данных IMDb
Continue reading "Работа с текстовыми данными в Pandas"

Как улучшить анализ данных: эффективная чистка данных с помощью Python

Пересказ статьи Muhammad Mustafa. How to Boost Your Data Analysis: A Guide to Effective Data Cleaning with Python


В эру больших данных на бизнес и разработчиков обрушиваются огромные объемы информации. При этом данные зачастую далеко не идеальны и требуют значительной подготовки, прежде чем они смогут использоваться для анализа. Очистка данных - это обнаружение и исправление ошибок, несогласованности и неточности в наборах данных, чтобы гарантировать качество данных. Python с его богатой экосистемой библиотек предлагает мощные инструменты для эффективной очистки и подготовки данных для анализа. В этой статье мы рассмотрим различные методы и библиотеки Python, которые могут помочь вам привести ваши данные в порядок.
Continue reading "Как улучшить анализ данных: эффективная чистка данных с помощью Python"

Как, используя Python, подключиться к SQL Server и выполнить запрос

Пересказ статьи Haq Nawaz. How to Connect & Query SQL Server using Python


Сегодня я расскажу, как подключиться к базам данных SQL, используя Python. Это распространенный вопрос, который возникает в серии ETL. Поэтому я решил рассмотреть его и направлять посетителей сюда, если у них возникнут проблемы с подключением.

Эта установка SQL Server позволит нам:

  • Установить подключение к базе данных SQL Server из Python

  • Выполнять запросы к базе данных SQL Server

  • Извлекать и сохранять данные в фрейме данных

Continue reading "Как, используя Python, подключиться к SQL Server и выполнить запрос"

Практический анализ данных с Pandas

Пересказ статьи Tirendaz AI. Practical Data Analysis with Pandas


Реально существующие данные - "грязные". Они требуют предварительной очистки, чтобы осуществлять их анализ. Pandas является наиболее часто используемой библиотекой Python для очистки данных. В то же время Pandas является очень мощной библиотекой для анализа данных. В этой статье я покажу вам, как анализировать данные с помощью Pandas на реальном наборе данных.
Continue reading "Практический анализ данных с Pandas"

Как импортировать файл Excel в MySQL Workbench, используя Python

Пересказ статьи Priyanshu Garg. How To Import Excel File into MySQL Workbench Using Python


Существуют различные методы, с помощью которых мы можем загрузить данные в MySQL, такие как команда Load data infile и мастер импорта табличных данных. Зачем тогда нам нужен Python для загрузки данных в MySQL Workbench? Причина проста:
  1. Чем больше данных, тем больше времени займет загрузка данных в MySQL Workbench.

  2. Не нужно создавать схему таблицы, Python автоматически сделает это за вас.
Continue reading "Как импортировать файл Excel в MySQL Workbench, используя Python"

Python для анализа и визуализации данных

Пересказ статьи Muhammad Sa'duddin. Python for Data Analysis and Data Visualization


Ранее мы обсуждали анализ данных с помощью SQL. Теперь я выполню анализ данных, используя Python. Но прежде, если вы хотите прочитать мою статью об анализе с помощью SQL, вот ссылка.

Для тех, кто не в курсе, скажу, что Python является языком программирования, который может использоваться в web и разработке программного обеспечения, науке о данных и анализе данных. Python классифицируется как высокоуровневый язык программирования, который довольно легко изучить и который весьма популярен в настоящее время. Continue reading "Python для анализа и визуализации данных"

От SQL к Pandas: руководство по переходу

Пересказ статьи Ashley Biddle. From SQL to Pandas: Your Translation Guide!


5 распространенных запросов SQL, транслируемых в функции Pandas.

В то время как SQL является основным языком для выборки данных в реляционных базах данных, а Pandas является популярной библиотекой Python для манипуляции данными, SQL и Pandas во многом похожи. Понимание основ SQL может облегчить изучение Pandas. Используйте ваши знания SQL для изучения манипуляции данными в Python с Pandas.
Continue reading "От SQL к Pandas: руководство по переходу"

Команды Pandas, которые я часто использую для анализа данных

Пересказ статьи Insufficient. Pandas Commands I Frequently Use to Analyze Data


Pandas является широко используемой библиотекой среди тех, кто занимается наукой о данных. Она позволяет манипулировать таблицей как мы того пожелаем. В этой статье я собираюсь поделиться с вами теми командами Pandas, которые я часто использую.

Здесь я буду в качестве примера использовать набор данных по статистике покемонов. Она не самая современная, но все еще используемая! В этой статье я буду называть dataframe сокращенно ‘df’.
Continue reading "Команды Pandas, которые я часто использую для анализа данных"

Получение в Python данных из MySQL

Пересказ статьи Robert Sheldon. Retrieving MySQL data from within Python


Приложения всех типов обычно получают доступ к MySQL для извлечения, добавления, обновления или удаления данных. Эти приложения могут быть написаны на Python, Java, C# или другом языке программирования. Большинство языков поддерживают множество методов для работы с базой данных MySQL и манипуляции ее данными.

Подход, который вы выбираете при доступе к MySQL, будет зависеть от используемого языка программирования и подключения, которое вы предпочтете для взаимодействия с базой данных. Какой бы подход вы ни выбрали, обычно в каждой среде применяются одни и те же основные принципы. Вы должны установить соединение с базой данных, а затем выполнять команды для извлечения или модификации данных. Continue reading "Получение в Python данных из MySQL"