Jak pamiętamy, Algorytm jest ślepy — nie może zobaczyć rzeźby trenu na którym się znajduje. Na schodach szedł w prawo, potem w lewo — sprawdzał swoje otoczenie. Teraz otoczenie ma więcej wymiarów, ale pomysł może być ten sam — sprawdzać zachowanie funkcji wyboruw sąsiedztwie punktu , w którym się aktualnie znajduje. Natychmiast pojawia się pytanie — jak duże powinno być to sąsiedztwo? Udzielenie przemyślanej odpowiedzi nie jest zagadnieniem łatwym, ponieważ wielkość przeszukiwanego obszaru ma, intuicyjnie, wpływ, z jednej strony na szybkość znalezienia ekstremum mierzoną ilością sprawdzanych obszarów (im większy tym szybciej), a z drugiej na dokładność Algorytmu (przy ograniczonych możliwościach przeszukiwania — im mniejszy tym dokładniej).
Inicjalizacja
Wybierz punkt początkowy .
Ustal początkowy obszar zaufania .
Podstaw .
Kroki algorytmu
Wyjaśnień wymagają kroki 2, 3, 6 i oczywiście kryterium stopu.
wybieramy duży krok początkowy ,
gdy to uznajemy za długość kroku,
gdy przeciwnie – zmniejszamy do ),
powtarzamy sprawdzenie czy wartość funkcji zmalała, itd. aż uzyskamy krok dający poprawę.
Wprawdzie wiemy, że „ruszanie się” wzdłuż kierunku poprawy nie musi doprowadzić do minimum globalnego, ale na pewno poprawi wartość funkcji celu. O ile poprawi ? – Może poprawić bardzo niewiele, ale tak jak przy ustalaniu podstaw poprzednich metod, zgodnie z naszym podejściem optymistycznym, uważamy że ta poprawa będzie istotna. Jak pamiętamy przekonanie to ma podstawy formalne, ponieważ rozważania teoretyczne sugerują, że „porządne” funkcje są lokalnie wypukłe, a co za tym idzie nie powinno być kłopotów ze znalezieniem punktu lepszego niż bieżący. Przy wymyślaniu kryterium stopu pomocny może być warunek stacjonarności gradientu wskazujący na możliwość konstrukcji kryterium stopu w oparciu o jakąś miarę „małości” gradientu.
Podstawowy algorytm kierunków poprawy
Inicjalizacja
Wybierz punkt początkowy .
Podstaw .
Kroki algorytmu
a) liniowo, gdy dodatkowo
lim,
b) superliniowo, gdy dodatkowo
lim,
c) kwadratowo, gdy dodatkowo
lim.
Definicje szybkości związane są z szybkością zbiegania do zera:
postępu geometrycznego o dodatnim ilorazie mniejszym niż jeden, np. danego wzorem
, bo –zbieżność liniowa, np. ciągu danego wzorem
, bo – zbieżność superliniowa, np. ciągu danego wzorem
, bo – zbieżność kwadratowa.
Widać że zbieżność liniowa jest najwolniejsza, a kwadratowa - najszybsza. Różne eksperymenty pokazały, że w zastosowaniach praktycznych szybkość liniowa jest do zaakceptowania gdy granica jest dostatecznie mała, nie większa niż .