Matplotlib este o bibliotecă de plotare puternică folosită în limbajul de programare Python. Oferă un API orientat pe obiecte pentru încorporarea graficelor în aplicații care utilizează seturi de instrumente GUI de uz general, cum ar fi Tkinter, wxPython sau Qt. Unul dintre instrumentele importante oferite de Matplotlib este capacitatea de a crea un grafic cu interval de încredere.
Intervalul de încredere, ca termen statistic, se referă la gradul de certitudine într-o metodă de eșantionare. Un nivel de încredere vă spune cât de sigur puteți fi, exprimat ca procent. De exemplu, un nivel de încredere de 99% sugerează că fiecare dintre estimările dvs. de probabilitate este probabil să fie corectă în 99% din timp.
Crearea unui grafic cu interval de încredere utilizând Matplotlib
Crearea unui grafic cu interval de încredere în Matplotlib implică mai mulți pași. Să ne aprofundăm în explicația codului Python corespunzător pentru a realiza acești pași:
Mai întâi, trebuie să importam bibliotecile necesare:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Acum, putem calcula intervalul de încredere urmând acești pași.
1. Determinați un set de date aleatoriu pentru care vom calcula intervalul de încredere.
2. Calculați eroarea medie și standard a setului de date.
3. Determinați marja de eroare pentru intervalul de încredere.
4. În cele din urmă, calculați intervalul intervalului de încredere.
Iată codul Python corespunzător acestor pași.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
Variabila „încredere” este nivelul de încredere exprimat ca procent, iar „date” conține setul de date aleatoriu. Eroarea medie și standard sunt calculate de funcția „medie” și, respectiv, „sem” a bibliotecii SciPy. Marja de eroare „h” este determinată prin înmulțirea erorii standard cu scorul t, pe care îl obținem din distribuția t folosind funcția „ppf”. În cele din urmă, calculăm intervalul intervalului de încredere.
Trasarea intervalului de încredere în Matplotlib
În această secțiune finală a codului, folosim Matplotlib pentru a vizualiza intervalul de încredere.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
Utilizează un grafic cu bare pentru a afișa datele și metoda „fill_between” pentru a reprezenta intervalul de încredere. Funcția „figură” inițializează o nouă figură, iar funcția „afișare” prezintă graficul.
Crearea unui grafic cu interval de încredere în Matplotlib este o modalitate convenabilă de a vă analiza vizual datele, în special datele care implică analize statistice. Acest instrument puternic oferă o modalitate simplă și intuitivă pentru a prezenta date complexe într-o formă care poate fi interpretată cu ușurință, făcându-le un set de instrumente esențial pentru orice analist de date sau om de știință Python. Înțelegând cum să manipulăm și să folosim acest lucru, putem face procesul de interpretare a datelor mai eficient și mai precis.