Skip to content

Работа с текстовыми данными в Pandas

Пересказ статьи Tirendaz AI. Working with Text Data in Pandas


Реальные наборы данных состоят не только из чисел, они также включают текст. При анализе данных важно уметь работать с этим текстом.
В этой статье я собираюсь поговорит на следующие темы:

  • Как использовать методы работы со строками в Pandas?

  • Как использовать регулярные выражения в Pandas?

  • Примеры работы с набором данных IMDb
Continue reading "Работа с текстовыми данными в Pandas"

Как улучшить анализ данных: эффективная чистка данных с помощью Python

Пересказ статьи Muhammad Mustafa. How to Boost Your Data Analysis: A Guide to Effective Data Cleaning with Python


В эру больших данных на бизнес и разработчиков обрушиваются огромные объемы информации. При этом данные зачастую далеко не идеальны и требуют значительной подготовки, прежде чем они смогут использоваться для анализа. Очистка данных - это обнаружение и исправление ошибок, несогласованности и неточности в наборах данных, чтобы гарантировать качество данных. Python с его богатой экосистемой библиотек предлагает мощные инструменты для эффективной очистки и подготовки данных для анализа. В этой статье мы рассмотрим различные методы и библиотеки Python, которые могут помочь вам привести ваши данные в порядок.
Continue reading "Как улучшить анализ данных: эффективная чистка данных с помощью Python"

Как, используя Python, подключиться к SQL Server и выполнить запрос

Пересказ статьи Haq Nawaz. How to Connect & Query SQL Server using Python


Сегодня я расскажу, как подключиться к базам данных SQL, используя Python. Это распространенный вопрос, который возникает в серии ETL. Поэтому я решил рассмотреть его и направлять посетителей сюда, если у них возникнут проблемы с подключением.

Эта установка SQL Server позволит нам:

  • Установить подключение к базе данных SQL Server из Python

  • Выполнять запросы к базе данных SQL Server

  • Извлекать и сохранять данные в фрейме данных

Continue reading "Как, используя Python, подключиться к SQL Server и выполнить запрос"

Практический анализ данных с Pandas

Пересказ статьи Tirendaz AI. Practical Data Analysis with Pandas


Реально существующие данные - "грязные". Они требуют предварительной очистки, чтобы осуществлять их анализ. Pandas является наиболее часто используемой библиотекой Python для очистки данных. В то же время Pandas является очень мощной библиотекой для анализа данных. В этой статье я покажу вам, как анализировать данные с помощью Pandas на реальном наборе данных.
Continue reading "Практический анализ данных с Pandas"

Как импортировать файл Excel в MySQL Workbench, используя Python

Пересказ статьи Priyanshu Garg. How To Import Excel File into MySQL Workbench Using Python


Существуют различные методы, с помощью которых мы можем загрузить данные в MySQL, такие как команда Load data infile и мастер импорта табличных данных. Зачем тогда нам нужен Python для загрузки данных в MySQL Workbench? Причина проста:
  1. Чем больше данных, тем больше времени займет загрузка данных в MySQL Workbench.

  2. Не нужно создавать схему таблицы, Python автоматически сделает это за вас.
Continue reading "Как импортировать файл Excel в MySQL Workbench, используя Python"

Python для анализа и визуализации данных

Пересказ статьи Muhammad Sa'duddin. Python for Data Analysis and Data Visualization


Ранее мы обсуждали анализ данных с помощью SQL. Теперь я выполню анализ данных, используя Python. Но прежде, если вы хотите прочитать мою статью об анализе с помощью SQL, вот ссылка.

Для тех, кто не в курсе, скажу, что Python является языком программирования, который может использоваться в web и разработке программного обеспечения, науке о данных и анализе данных. Python классифицируется как высокоуровневый язык программирования, который довольно легко изучить и который весьма популярен в настоящее время. Continue reading "Python для анализа и визуализации данных"

От SQL к Pandas: руководство по переходу

Пересказ статьи Ashley Biddle. From SQL to Pandas: Your Translation Guide!


5 распространенных запросов SQL, транслируемых в функции Pandas.

В то время как SQL является основным языком для выборки данных в реляционных базах данных, а Pandas является популярной библиотекой Python для манипуляции данными, SQL и Pandas во многом похожи. Понимание основ SQL может облегчить изучение Pandas. Используйте ваши знания SQL для изучения манипуляции данными в Python с Pandas.
Continue reading "От SQL к Pandas: руководство по переходу"

Команды Pandas, которые я часто использую для анализа данных

Пересказ статьи Insufficient. Pandas Commands I Frequently Use to Analyze Data


Pandas является широко используемой библиотекой среди тех, кто занимается наукой о данных. Она позволяет манипулировать таблицей как мы того пожелаем. В этой статье я собираюсь поделиться с вами теми командами Pandas, которые я часто использую.

Здесь я буду в качестве примера использовать набор данных по статистике покемонов. Она не самая современная, но все еще используемая! В этой статье я буду называть dataframe сокращенно ‘df’.
Continue reading "Команды Pandas, которые я часто использую для анализа данных"

Получение в Python данных из MySQL

Пересказ статьи Robert Sheldon. Retrieving MySQL data from within Python


Приложения всех типов обычно получают доступ к MySQL для извлечения, добавления, обновления или удаления данных. Эти приложения могут быть написаны на Python, Java, C# или другом языке программирования. Большинство языков поддерживают множество методов для работы с базой данных MySQL и манипуляции ее данными.

Подход, который вы выбираете при доступе к MySQL, будет зависеть от используемого языка программирования и подключения, которое вы предпочтете для взаимодействия с базой данных. Какой бы подход вы ни выбрали, обычно в каждой среде применяются одни и те же основные принципы. Вы должны установить соединение с базой данных, а затем выполнять команды для извлечения или модификации данных. Continue reading "Получение в Python данных из MySQL"

Обработка исключений в Python, используя Try, Except, Else и Finally

Пересказ статьи Achyut Tripathi. Python Exception Handling using Try, Except, Else and Finally


Ошибки компиляции и времени исполнения являются двумя категориями проблем, которые могут возникать в любом языке программирования. Ошибки компиляции выявляются на стадии компиляции исходного кода и вызываются неправильным синтаксисом или семантикой. Ошибки времени исполнения обрабатываютcя иначе, и мы рассмотрим различные аспекты обработки на примере кода Python.

Обработка ошибок делает код более надежным, защищая его от ошибок, которые могут вызвать неожиданное прерывание работы программы. Концепция обработки исключений в Python используется для обслуживания ошибок и исключений.
Continue reading "Обработка исключений в Python, используя Try, Except, Else и Finally"

Импорт данных из файла Excel в базу данных SQL Server с помощью Python

Пересказ статьи Levi Masonde. Import Data from an Excel file into a SQL Server Database using Python


Есть много способов загрузить данные из Excel в SQL Server, но иногда полезно использовать те инструменты, которые вы знаете лучше всего. В этой статье мы рассмотрим как загружать данные из Excel в SQL Server с помощью Python. Continue reading "Импорт данных из файла Excel в базу данных SQL Server с помощью Python"

Как автоматизировать серверные процессы в экземпляре SQL Server с помощью Python

Пересказ статьи Ian Fogelman. How to Automate Backend Processes in SQL Server Instance with Python


Автоматизация серверных (backend) процессов в экземпляре SQL Server является традиционной задачей. Будь то обновление статистики, перестройка индексов, чтение или удаление данных или другие среды программирования, интегрирующиеся с RDMS, все это исключительно важно. В этой статье рассматриваются те виды задач, которые могут быть выполнены с помощью различных методов, доступных в модулях Python.

Continue reading "Как автоматизировать серверные процессы в экземпляре SQL Server с помощью Python"

Краткое руководство по запуску кода Python в SQL Server

Пересказ статьи Emmitt Albright. A Quick Start to Running Python Code in SQL Server


В SQL Server 2016 была реализована идея выполнения скрипта на языке R изнутри SQL Server. В SQL Server 2017 эта возможность получила название Machine Learning Services (службы машинного обучения) и расширена возможностью выполнять код на языке Python. В этой статье дается краткое руководство по выполнению кода Python изнутри SQL Server и новым методам преобразования данных.
Continue reading "Краткое руководство по запуску кода Python в SQL Server"

Пример применения функции Substring в T-SQL, R и Python

Пересказ статьи Siddharth Mehta. SQL Server Substring Function Example with T-SQL, R and Python



Проблема


Манипуляция со строками является одним из наиболее фундаментальных элементов работы с данными, используемом почти в каждом примере преобразования данных. Основными целями манипуляции со строками являются форматирование, усечение, набивка, замена и аналогичные функции. Часто для применения этих функций требуется выбрать конкретную часть строки, и затем применить преобразования. В SQL Server имеется три языка, которые часто используются в связке - T-SQL, R и Python. Все эти языки программирования/запросов предоставляют возможность выбора подстроки с помощью функции substring или эквивалентной функции/оператора. Здесь мы научимся использовать функцию substring для выбора строки на всех трех языках.
Continue reading "Пример применения функции Substring в T-SQL, R и Python"