Nadmierne dopasowanie
Co to jest przeuczenie?Przeregulowanie to błąd modelowania, który występuje, gdy funkcja jest zbyt ściśle dopasowana do ograniczonego zestawu punktów danych. Nadmierne dopasowanie modelu ogólnie polega na stworzeniu zbyt złożonego modelu, aby wyjaśnić osobliwości badanych danych.
W rzeczywistości często badane dane zawierają pewien stopień błędu lub przypadkowego szumu. Dlatego też próba zbyt ścisłego dopasowania modelu do nieco niedokładnych danych może zainfekować model poważnymi błędami i zmniejszyć jego moc predykcyjną.
[Ważne: Specjaliści finansowi muszą zawsze zdawać sobie sprawę z niebezpieczeństw związanych z nadmiernym dopasowaniem modelu w oparciu o ograniczone dane.]
Zrozumienie nadmiernego dopasowania
Na przykład częstym problemem jest używanie algorytmów komputerowych do przeszukiwania rozległych baz danych historycznych danych rynkowych w celu znalezienia wzorców. Biorąc pod uwagę wystarczającą liczbę badań, często możliwe jest opracowanie szczegółowych twierdzeń, które wydają się przewidywać takie rzeczy, jak zwroty z rynku akcji z dużą dokładnością.
Jednak w przypadku zastosowania do danych poza próbą, te twierdzenia mogą prawdopodobnie okazać się po prostu zbyt dużym dopasowaniem modelu do tego, co w rzeczywistości było przypadkowymi przypadkami. We wszystkich przypadkach ważne jest przetestowanie modelu na danych, które znajdują się poza próbą użytą do jego opracowania.
Kluczowe dania na wynos
- Przeregulowanie to błąd modelowania, który występuje, gdy funkcja jest zbyt ściśle dopasowana do ograniczonego zestawu punktów danych.
- Specjaliści ds. Finansów muszą zawsze zdawać sobie sprawę z niebezpieczeństw związanych z nadmiernym dopasowaniem modelu w oparciu o ograniczone dane.