Seaborn BoxPlot

С помощью модуля seaborn в Python можно создавать различные статистические графики и графики. Мы можем создать коробчатую диаграмму с помощью функции seaborn.boxplot().

Аналитики и статистики часто используют коробчатую диаграмму для представления данных по разным уровням или категориям. Рисунок прямоугольной диаграммы может передавать множество статистических значений. Следующий рисунок объясняет это.

Информация о коробчатом графике

Функция boxplot() эффективно работает при построении категориальных значений набора данных, а также может работать с отдельными списками или векторами массивов. Это очень похоже на скрипичный сюжет.

В следующем примере мы строим коробчатую диаграмму для одного распределения, чтобы получить некоторое представление об окончательной цифре.

import random 
import numpy as np
import seaborn as sns

n = random.sample(range(0,50),30) 
arr = np.array(n)
sns.boxplot(n)

коробчатая диаграмма для одной переменной

Мы также можем построить диаграмму рассеяния по коробчатой ​​диаграмме. Это даст вам лучшее представление о построенном распределении и окончательной цифре.

Мы будем использовать функцию seaborn.stripplot() для построения диаграммы разброса. Например,

import random 
import numpy as np
import seaborn as sns

n = random.sample(range(0,50),30) 
arr = np.array(n)
sns.boxplot(n)
sns.stripplot(n, color = 'red')

разметка на коробчатом участке

Ящичную диаграмму можно эффективно использовать для построения категориальных переменных и упрощения их сравнения. В следующем коде мы построим коробчатую диаграмму для нескольких категорий.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame({"Quantity": [5,6,7,8,5,6,7,8,5,6,7,8,5,6,7,8],
                   "Price": [9,10,15,16,13,14,15,18,11,12,14,15,16,17,18,19],
                   "Day" : [1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2],
                   "Product": ['A','A','A','A','B','B','B','B',
                              'A','A','A','A','B','B','B','B']})

sns.boxplot(data = df, y = "Price", x = "Quantity")

коробчатая диаграмма для категориальных данных

Обратите внимание, как в приведенном выше наборе данных мы можем легко сравнить цену в разных количествах. Также мы можем добавить параметр hue и установить его значение как переменную Product. Таким образом, мы сможем построить разные коробки для разных продуктов.

Мы можем использовать matplotlib.pyplot.ylim() и matplotlib.pyplot.xlim(), чтобы установить пределы по осям x и y графика.

Мы можем использовать гораздо больше параметров, чтобы настроить окончательный сюжет. Параметр linewidth можно использовать для увеличения толщины границ рамочной диаграммы. Мы можем настроить цвета для разных категорий с помощью параметра palette. Ориентацию можно изменить с помощью аргумента orient. Можно использовать еще много таких аргументов.

См. Приведенный ниже код, чтобы понять применение некоторых из этих параметров.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame({"Quantity": [5,6,7,8,5,6,7,8,5,6,7,8,5,6,7,8],
                   "Price": [9,10,15,16,13,14,15,18,11,12,14,15,16,17,18,19],
                   "Day" : [1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2],
                   "Product": ['A','A','A','A','B','B','B','B',
                              'A','A','A','A','B','B','B','B']})

sns.boxplot(data = df, y = "Price", x = "Quantity", hue = 'Product', linewidth = 2.5 , palette = 'Set2')

коробчатая диаграмма для нескольких столбцов с аргументами

Мы также можем использовать функцию catplot(), чтобы создать коробчатую диаграмму. Функция catplot() очень хорошо работает для построения категориальных значений. Для создания блочной диаграммы с помощью этой функции нам необходимо указать значение параметра kind в функции catplot() как box.