Постройте график с помощью функции seaborn.lmplot()

Модуль seaborn используется для создания статистических графиков в Python. Он построен на модуле matplotlib, поэтому очень прост в использовании.

Функция seaborn.lmplot() создает базовую диаграмму рассеяния, используя данные в FacetGrid.

См. Следующий код.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random

x = range(50)
y = random.sample(range(100),50)
cat = [i for i in range(2)]*25
df = pd.DataFrame({"x": x,
                   "y": y,
                  'Category':cat})

sns.lmplot(x= 'x', y = 'y', data = df, fit_reg = False, hue = 'Category')

функция seaborn lmplot

Однако использование этой функции превосходит построение графиков рассеяния. Его также можно использовать для понимания взаимосвязи между данными путем нанесения на график необязательной линии регрессии. Его также можно использовать для логистической регрессии.

В отличие от функции seaborn.regplot(), которая также используется для выполнения простой регрессии и построения графика данных, функция seaborn.lmplot() объединяет класс seaborn.FacetGrid() с классом seaborn.regplot() Функция.

FacetGrid() используется для визуализации взаимосвязи между распределением данных с другими подмножествами данных и может использоваться для создания сеток для нескольких графиков. Он работает по трем осям, обеспечивая строки, столбцы и оттенки. Это очень полезно, когда мы работаем со сложным набором данных.

Мы также можем настроить окончательную фигуру, используя различные параметры с помощью функции seaborn.lmplot(). Мы можем предоставить необходимые настройки, такие как цвет графика, в виде пар ключ-значение словаря для параметра line_kws и scatter_kws.

В приведенном ниже коде мы построим график с линией регрессии, используя эту функцию.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random

x = range(50)
y = random.sample(range(100),50)
cat = [i for i in range(2)]*25
df = pd.DataFrame({"x": x,
                   "y": y,
                  'Category':cat})

sns.lmplot(x= 'x', y = 'y', data = df, hue = 'Category')

функция seaborn lmplot

Обратите внимание, что для параметра fit_reg по умолчанию установлено значение True. В нашем наборе данных было несколько категорий, поэтому мы смогли построить несколько линий регрессии. Если бы мы убрали параметр hue, то был бы получен единый график регрессии. Мы также можем использовать многие параметры для нашей регрессии. Некоторые из них включают аргумент jitter, который используется для добавления некоторого шума к данным, или параметр estimator, используемый для построения графика по заданному оценочному значению.