Nauka o danych

Samouczek histogram() Pythona NumPy

Samouczek histogram() Pythona NumPy
Histogram to odwzorowanie interwałów na częstotliwości. Służy do aproksymacji funkcji gęstości prawdopodobieństwa danej zmiennej. Znany jest również jako wykres słupkowy. W Pythonie dostępnych jest wiele opcji do budowania i kreślenia histogramów. Biblioteka NumPy Pythona jest przydatna do operacji naukowych i matematycznych. Jedną z ważnych funkcji tej biblioteki jest implementacja histogramu za pomocą funkcji histogram(). Ta funkcja służy do tworzenia histogramu, który przedstawia graficznie rozkład częstotliwości danych. Na histogramie przedziały klas są reprezentowane przez biny, które wyglądają jak poziome prostokąty, a zmienna wysokość reprezentuje częstotliwości. Znajomość tworzenia tablicy NumPy jest niezbędna do zrozumienia przykładów przedstawionych w tym samouczku.

Składnia:

numpy.histogram(tablica_wejściowa, pojemniki=10, zakres=Brak, unormowany=Brak, wagi=Brak, gęstość=Brak)

Ta funkcja może przyjąć sześć argumentów, aby zwrócić obliczony histogram zbioru danych. Cele tych argumentów wyjaśniono poniżej.

Ta funkcja może zwrócić dwie tablice. Jedną z nich jest tablica hist zawierająca zestaw danych histogramu. Inną jest tablica krawędzi, która zawiera wartości bin.

Przykład 1: Wydrukuj tablicę histogramu

Poniższy przykład pokazuje użycie funkcji histogram() z tablicą jednowymiarową i argumentu bins z wartościami sekwencyjnymi. Tablica 5 liczb całkowitych została użyta jako tablica wejściowa, a tablica 5 kolejnych wartości została użyta jako wartość bins. Zawartość tablicy histogramu i tablicy bin zostanie wydrukowana razem jako dane wyjściowe.

# Importuj bibliotekę NumPy
importuj numer jako np
# Wywołaj funkcję histogram(), która zwraca dane histogramu
np_tablica = np.histogram([10, 3, 8, 9, 7], bins=[2, 4, 6, 8, 10])
# Wydrukuj wynik histogramu
print("Wyjście histogramu to: \n", np_array)

Wynik:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Przykład 2: Wydrukuj histogram i tablice bin

Poniższy przykład pokazuje, jak można utworzyć tablicę histogramu i tablicę bin za pomocą funkcji histogram(). Tablica NumPy została utworzona za pomocą funkcji aranż() w skrypcie. Następnie funkcja histogram() wywołała oddzielne zwrócenie tablicy histogramu i wartości tablicy bin.

# Importuj bibliotekę NumPy
importuj numer jako np
# Utwórz tablicę NumPy za pomocą arange()
np_tablica = np.aranżacja(90)
# Utwórz dane histogramu
hist_array, bin_array = np.histogram(tab_np, bins=[0, 10, 25, 45, 70, 100])
# Wydrukuj tablicę histogramu
print("Dane tablicy histogramu to: ", hist_array)
# Wydrukuj tablicę bin
print("Dane tablicy bin to: ", tablica_bin)

Wynik:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Przykład 3: Wydrukuj histogram i tablice bin na podstawie argumentu gęstości

Poniższy przykład pokazuje użycie use gęstość argument funkcji histogram() do utworzenia tablicy histogramu. Tablica NumPy składająca się z 20 liczb jest tworzona za pomocą funkcji arange(). Pierwsza funkcja histogram() jest wywoływana przez ustawienie gęstość wartość do Fałszywe. Druga funkcja histogram() jest wywoływana przez ustawienie gęstość wartość do Prawdziwe.

# importuj tablicę NumPy
importuj numer jako np
# Utwórz tablicę NumPy z 20 numerami sekwencyjnymi
np_tablica = np.aranżacja(20)
# Oblicz dane histogramu z fałszywą gęstością
hist_array, bin_array = np.histogram(tab_np, gęstość=Fałsz)
print("Wyjście histogramu przez ustawienie gęstości na False: \n", hist_array)
print("Wyjście tablicy bin : \n", tablica_bin)
# Oblicz dane histogramu z prawdziwą gęstością
hist_array, bin_array = np.histogram(tab_np, gęstość=prawda)
print("\nWyjście histogramu przez ustawienie gęstości na Prawda: \n", hist_array)
print("Wyjście tablicy bin : \n", tablica_bin)

Wynik:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Przykład 4: Narysuj wykres słupkowy przy użyciu danych histogramu

Musisz zainstalować bibliotekę matplotlib Pythona, aby narysować wykres słupkowy przed wykonaniem skryptu tego przykładu. hist_array i bin_array zostały utworzone za pomocą funkcji histogram(). Tablice te zostały użyte w funkcji bar() biblioteki matplotlib do utworzenia wykresu słupkowego.

# importuj potrzebne biblioteki
importuj bibliotekę matplotlib.pyplot jako plt
importuj numer jako np
# Utwórz zbiór danych histogramu
hist_array, bin_array = np.histogram([4, 10, 3, 13, 8, 9, 7], bins=[2, 4, 6, 8, 10, 12, 14])
# Ustaw kilka konfiguracji wykresu
plt.figura(rozmiar=[10, 5])
plt.xlim(min(tab_bin), max(tablica_bin))
plt.siatka(oś='y', alfa=0.75)
plt.xlabel('Wartości krawędzi', rozmiar czcionki=20)
plt.ylabel('Wartości histogramu', rozmiar czcionki=20)
plt.title('Wykres histogramu', rozmiar czcionki=25)
# Utwórz wykres
plt.bar(bin_array[:-1], hist_array, szerokość=0.5, kolor = "niebieski")
# Wyświetl wykres
plt.pokazać()

Wynik:

Następujące dane wyjściowe pojawią się po wykonaniu powyższego skryptu.

Wniosek:

Funkcja histogram() została wyjaśniona w tym samouczku przy użyciu różnych prostych przykładów, które pomogą czytelnikom poznać cel używania tej funkcji i zastosować ją poprawnie w skrypcie.

Linux tar Command
Tar is a tool that's used for managing compressed archive files. The term “tar” stands for “tape archive”. It got its name because large number of Lin...
Polecenie cp dla systemu Linux
„cp” to wbudowane narzędzie dla wszystkich platform opartych na systemie UNIX, które są używane do tworzenia kopii plików i katalogów. Jak sugeruje na...
Polecenie Bash-pułapki
Wbudowane polecenie bash, które jest używane do wykonania polecenia, gdy powłoka odbierze jakikolwiek sygnał, nazywa się „trap”. Gdy wystąpi jakiekolw...