Główny » handel algorytmiczny » Nadmierne dopasowanie

Nadmierne dopasowanie

handel algorytmiczny : Nadmierne dopasowanie
Co to jest przeuczenie?

Przeregulowanie to błąd modelowania, który występuje, gdy funkcja jest zbyt ściśle dopasowana do ograniczonego zestawu punktów danych. Nadmierne dopasowanie modelu ogólnie polega na stworzeniu zbyt złożonego modelu, aby wyjaśnić osobliwości badanych danych.

W rzeczywistości często badane dane zawierają pewien stopień błędu lub przypadkowego szumu. Dlatego też próba zbyt ścisłego dopasowania modelu do nieco niedokładnych danych może zainfekować model poważnymi błędami i zmniejszyć jego moc predykcyjną.

[Ważne: Specjaliści finansowi muszą zawsze zdawać sobie sprawę z niebezpieczeństw związanych z nadmiernym dopasowaniem modelu w oparciu o ograniczone dane.]

Zrozumienie nadmiernego dopasowania

Na przykład częstym problemem jest używanie algorytmów komputerowych do przeszukiwania rozległych baz danych historycznych danych rynkowych w celu znalezienia wzorców. Biorąc pod uwagę wystarczającą liczbę badań, często możliwe jest opracowanie szczegółowych twierdzeń, które wydają się przewidywać takie rzeczy, jak zwroty z rynku akcji z dużą dokładnością.

Jednak w przypadku zastosowania do danych poza próbą, te twierdzenia mogą prawdopodobnie okazać się po prostu zbyt dużym dopasowaniem modelu do tego, co w rzeczywistości było przypadkowymi przypadkami. We wszystkich przypadkach ważne jest przetestowanie modelu na danych, które znajdują się poza próbą użytą do jego opracowania.

Kluczowe dania na wynos

  • Przeregulowanie to błąd modelowania, który występuje, gdy funkcja jest zbyt ściśle dopasowana do ograniczonego zestawu punktów danych.
  • Specjaliści ds. Finansów muszą zawsze zdawać sobie sprawę z niebezpieczeństw związanych z nadmiernym dopasowaniem modelu w oparciu o ograniczone dane.
Porównaj rachunki inwestycyjne Nazwa dostawcy Opis Ujawnienie reklamodawcy × Oferty przedstawione w tej tabeli pochodzą od partnerstw, od których Investopedia otrzymuje wynagrodzenie.

Terminy pokrewne

Dlaczego znaczenie statystyczne ma znaczenie Znaczenie statystyczne odnosi się do wyniku, który prawdopodobnie nie wystąpi losowo, ale raczej można go przypisać konkretnej przyczynie. więcej Jak działa wygładzanie danych Wygładzanie danych odbywa się za pomocą algorytmu do usuwania szumu z zestawu danych. Pozwala to wyróżnić ważne wzory. Wygładzanie danych może służyć do przewidywania trendów, takich jak te występujące w cenach papierów wartościowych. więcej Próbka Próbka jest mniejszą, łatwiejszą do zarządzania wersją większej grupy. Próbki są używane w testach statystycznych, gdy liczebność populacji jest zbyt duża. więcej Heteroskedastyczność W statystykach heteroskedastyczność ma miejsce, gdy odchylenia standardowe zmiennej, monitorowane przez określony czas, nie są stałe. więcej Czytanie do warstwowego losowego próbkowania Stratyfikowane losowe próbkowanie to metoda próbkowania polegająca na podziale populacji na mniejsze grupy zwane warstwami. więcej Jak działają proste losowe próbki Prosta losowa próbka jest podzbiorem populacji statystycznej, w którym każdy członek tego podzbioru ma równe prawdopodobieństwo wyboru. Prosta próbka losowa ma być obiektywną reprezentacją grupy. więcej linków partnerskich
Zalecane
Zostaw Swój Komentarz