pandas melt что делает

Pandas elt () и нерясь с помощью функции pivot ()

Функция Pandas Melt () используется для изменения формата DataFrame из шириной до длительного времени. Он используется для создания определенного формата объекта DataFrame, где один

Функция Pandas Melt () используется для изменения формата DataFrame из шириной до длительного времени. Он используется для создания определенного формата объекта DataFrame, в котором один или несколько столбцов работают как идентификаторы. Все оставшиеся столбцы рассматриваются как значения и необотаются на ось строки и только два столбца – Переменная и ценность Отказ

1. Pandas Melt () Пример

Использование функции MELT () более ясна при просмотре примера.

Мы можем передавать параметры «var_name» и «value_name», чтобы изменить имена столбцов «Переменную» и «значение».

2. Несколько колонн как id_vars

Посмотрим, что произойдет, когда мы передаем несколько столбцов в качестве параметра ID_VARS.

3. Пропуск колонн в функции MELT ()

Не требуется использовать все строки из источника DataFrame. Давайте пропустим столбец «ID» в следующем примере.

4. Невозможное значение dataframe с использованием функции pivot ()

Мы можем использовать функцию Pivot (), чтобы нерешить объект DataFrame и получить исходное dataframe. Значение параметра функции Pivot () () должно быть таким же, как значение «id_vars». Значение «столбцов» следует пропущено как имя столбца «Переменная».

Неожиданные значения DataFrame такие же, как исходное dataframe. Но столбцы и индекс нуждаются в незначительных изменениях, чтобы сделать его точно так же, как оригинальный кадр данных.

Источник

Преобразование данных в Python с помощью Pandas Melt

Дата публикации Apr 25, 2018

Всемирный банк принимает один избогатейшие источники данныхна паутинах. Эти данные имеют много практических применений, таких как прогнозирование экономического роста илипрогнозирование бедности с помощью машинного обучения, Недавно я использовал эти данные для создания нескольких таблиц визуализации роста ВВП на душу населения в странах Африки к югу от Сахары (годовой рост,совокупный рост).

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Однако на этом пути было большое препятствие. Мои данные Всемирного банка не работали с Таблицей. Таблицы лучше разработаны для форматирования в стиле базы данных, чем обычное форматирование, которое вы видите в Excel для финансовых и экономических данных.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Мне пришлось преобразовать данные, чтобы они работали в Таблице. Одним из способов сделать это в Python являетсяPandas Melt, Pd.melt позволяет вам «разворачивать» данные из «широкого формата» в «длинный формат», что идеально подходит для моей задачи: взять экономические данные «широкого формата», где каждый столбец представляет год, и преобразовать их в данные «длинного формата» с каждой строкой, представляющей точку данных.

Получение данных

Прежде чем перейти к кодированию, я хочу показать вам, как получить доступ к данным. Если вы хотите узнать только о pandas.melt, не стесняйтесь переходить к следующему разделу («Преобразование с помощью Pandas Melt»). Если вы хотите выполнить полное руководство (получение данных Всемирного банка и создание анимации в виде таблицы), первым делом перейдите кВсемирный банк открытых данныхВеб-сайт.

Есть много разных способов доступа к данным ВВП на душу населения. Вы можете нажать «Обзор по индикатору» (см. Оранжевое поле на изображении ниже) на главной странице, а затем прокрутить вниз до раздела «Экономика и рост», где вы найдете несколько показателей ВВП на душу населения.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Кроме того, вы можете начать вводить нужную меру в строке поиска.

Для моего анализа я сделал годовой и кумулятивный рост ВВП на душу населения; обе меры требуют немного большей сложности, поэтому давайте упростим и вместо этого сосредоточимся на «росте ВВП на душу населения (годовой%)». Как только вы выберете свою категорию, вы получите мировые данные. Вы можете нажать «Карта», чтобы просмотреть данные по стране и году. Нам нужно перейти в «Банк данных», чтобы напрямую изучить эти данные.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

В итоге мы получим сложный экран, похожий на изображение ниже:

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Есть некоторые разочарования, связанные с данными Всемирного банка. Если вы продолжаете, я рекомендую попытаться сделать что-то более простое, чем я сделал с ростом в странах Африки к югу от Сахары. Вместо этого сосредоточьтесь на Южной Америке, в которой меньше стран.

Сначала нам нужно «отменить выбор всех». Затем мы выберем несколько стран Южной Америки: Аргентину, Бразилию, Чили, Перу и Венесуэлу. Не стесняйтесь добавлять и другие к вашему набору данных, если вы хотите более полную презентацию (Парагвай, Урагвай, Боливия, Эквадор, Колумбия, Гайана, Суринам). Теперь посмотрите на «Время» и убедитесь, что все годы с 2000 по 2016 год проверены.

Найдите «Параметры загрузки» в правом верхнем углу экрана и загрузите файл Excel. У нас большой набор данных, который выглядит примерно так:

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Проблема в том, что Tableau хочет использовать формат базы данных. Нам нужны наши данные, чтобы они выглядели так:

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Обратите внимание, что разница состоит в том, что вместо столбцов для каждого отдельного года форматирование в стиле базы данных имеет отдельную строку для каждой страны и даты.

Прежде чем мы используем pandas.melt, нам нужно сначала немного очистить наши данные. Давайте удалим ненужные столбцы, такие как «Название серии», «Код серии» и «Код страны». Нам также нужно изменить даты на формат мм / дд / гггг. Мы можем сделать это на Python, но обычно проще набрать 12/31 / гггг (введите год для «гггг») в течение первых двух лет, а затем использовать Excelкоманда заполненияделать все остальное Наконец, удалите исходные данные внизу («Данные из базы данных», «Последнее обновление»). Теперь мы готовы преобразовать данные с помощью Python.

Преобразование с помощью Pandas Melt

Во-первых, нам нужно импортировать панд и набор данных. Это будет зависеть от вашего местоположения файла, но ваш код должен выглядеть примерно так.

Используйте df.head (), чтобы убедиться, что ваши данные загружены правильно. Теперь мы будем использовать pd.melt, чтобы переформатировать его.

Теперь преобразованные данные должны хорошо работать в Таблице.

Немного о Таблице

Поскольку это учебник Pandas Melt, я не буду тратить слишком много времени на Tableau, но если вы хотите посмотреть, как будет выглядеть ваша карта, вам сначала понадобится Tableau на вашем компьютере. Вы можете скачать бесплатную версию наОбщественная таблицаВеб-сайт.

Откройте Tableau Public. Подключитесь к файлу Excel. Загрузите ваши преобразованные данные Excel. Нажмите на «Лист 1» внизу Таблицы, и вы должны увидеть свои данные.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

В разделе «Размеры» вы увидите «Название страны». Перетащите его в большую рамку посередине экрана («перетащите сюда»). Посмотрите на раздел «Меры», и вы увидите «GDPperCapGr%». Перетащите это в поле «Цвет» Найдите «Дата» в разделе «Размеры» и перетащите его в поле «Фильтр». Выберите «Все» в течение нескольких лет.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Теперь снова перейдите к «Дата» и перетащите его в поле «Страницы» над «Фильтром». Вы увидите новое окно в дальнем правом углу экрана (я выделил его на изображении ниже, заключенном в черный ящик.) Нажмите кнопку «вперед», и вы получите отличную анимацию роста ВВП на душу населения по годам. Добавьте «Название страны» и «GDPperCapGr%» в поле «Метка», чтобы добавить метки.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Теперь у вас есть простая (хотя и не элегантная) анимация Tableau, с которой можно поиграть.

Выводы

Источник

Python | Панды dataframe.melt ()

Python — отличный язык для анализа данных, в первую очередь благодаря фантастической экосистеме пакетов Python, ориентированных на данные. Pandas является одним из таких пакетов и значительно упрощает импорт и анализ данных.

Функция Pandas dataframe.melt dataframe.melt() разворачивает DataFrame из широкоформатного в длинный формат, опционально оставляя установленные переменные идентификатора. Эта функция полезна для преобразования DataFrame в формат, в котором один или несколько столбцов являются переменными идентификатора (id_vars), в то время как все остальные столбцы, считающиеся измеренными переменными (value_vars), «не разворачиваются» на оси строк, оставляя только два неидентификатора. столбцы, «переменная» и «значение».

Syntax:DataFrame.melt(id_vars=None, value_vars=None, var_name=None, value_name=’value’, col_level=None)
Parameters :
frame : DataFrame
id_vars : Column(s) to use as identifier variables
value_vars : Column(s) to unpivot. If not specified, uses all columns that are not set as id_vars.
var_name : Name to use for the ‘variable’ column. If None it uses frame.columns.name or ‘variable’.
value_name : Name to use for the ‘value’ column
col_level : If columns are a MultiIndex then use this level to melt.

Returns: DataFrame into a format where one or more columns are identifier variables

Пример # 1: Используйте функцию melt() чтобы установить столбец «A» в качестве переменной-идентификатора и столбец «B» в качестве переменной-значения.

# импорт панд как pd

import pandas as pd

# Создание фрейма данных

# Распечатайте фрейм данных
df

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Давайте используем функцию dataframe.melt() чтобы установить столбец «A» в качестве переменной-идентификатора и столбец «B» в качестве переменной-значения.

# функция для разворота фрейма данных

df.melt(id_vars = [ ‘A’ ], value_vars = [ ‘B’ ])

Выход :
pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Пример # 2: Используйте функцию melt() чтобы установить столбец «A» в качестве переменной-идентификатора и столбец «B» и «C» в качестве переменной-значения. Также настройте имена столбцов значений и переменных.

# импорт панд как pd

import pandas as pd

# Создание фрейма данных

# Распечатайте фрейм данных
df

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Давайте используем функцию dataframe.melt() чтобы установить столбец «A» в качестве переменной-идентификатора и столбец «B» и «C» в качестве переменной-значения.

# функция для разворота фрейма данных
# Мы также предоставим индивидуальное имя для столбца значения и переменной

Источник

Data Independent pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Learning Data Analysis One CSV At A Time

Pandas Melt – pd.melt()

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Pandas Melt is not only one of my favorite function names (makes me think of face melting in India Jones – gross clip), but it’s also a crucial data analysis tool.

Pandas pd.melt() will simply turn a wide table, tall. This will ‘unpivot’ your data so column(s) get enumerated into rows.

I use this function I want to turn pretty data thats easy to read (many columns) into usable data (many rows) that is easier to analyze.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

In the above scenario, having two columns for dates (8/6 & 8/7) looks good, but it’s harder to do analysis on. I want turn those columns into row permutations.

Pseudo code: Take a column or columns, and transpose them into rows. “Unpivot” your data.

Pandas Melt

Pandas Melt is a function you’ll use when deciding the architecture of your of your data sets. This will ultimately lead to how you think about your analysis and questions you want to answer.

Melt Parameters

Here’s a Jupyter notebook showing how to Melt in Pandas

Источник

Pandas melt что делает

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Jun 17, 2018 · 6 min read

Reshaping Pandas Data frames with Melt & Pivot

Pandas is a wonderful data manipulation library in python. Working in the field of Data science and Machine learning, I find myself using Pandas pretty much everyday. It’s an invaluable tool for data analysis and manipulation.

In this short article, I will show you what Melt and Reverse melt (Unmelt) are in Pandas, and how you can use them for reshaping data frames.

pandas melt что делает. Смотреть фото pandas melt что делает. Смотреть картинку pandas melt что делает. Картинка про pandas melt что делает. Фото pandas melt что делает

Say, I have the data of the closing prices of stock market data of stock market closing prices of two major companies for last week as follows:

For an ana l ysis I want to do I need the names of the companies Google & Apple to appear in a single column with the stock price as another column, as shown below.

This is exactly where melt comes into picture. Melt is used for converting a bunch of columns into a single row, which is exactly what I need here.

Let’s see how we can do this:

First we need to import pandas

import pandas as pd

Now, we’ll create the Dataframe with the data I need:

And this will get us the dataframe we need as follows:

Let’s melt this now. To melt this dataframe, you call the melt() on the dataframe with the id_vars parameter set.

And you’re done. Your reshaped_df would like this now:

Unmelt/Reverse Melt/Pivot

Running the above command gives you the following:

This is close, but probably not exactly what you wanted. The Closing Price is an extra stacked column (index) on top of Google & Apple. So to get exactly the reverse of melt and get the original df dataframe we started with, we do the following:

And that gets us back to what we have started with.

That is all for this article. I hope this was useful for you and that you’ll try to use this in your data processing workflow.

For more programming articles, checkout Freblogg

Some python articles that you might find useful:

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *