Rozważmy implementację funkcji całkującej inne funkcje:
double integrate(double (*f)(double ),double min,double max,double ds) { double integral=.0; for(double x=min;x<max;x+=ds) { integral+=f(x); } return integral*ds; }
( Źródło: integrate.cpp)
Pomijając prostotę zaimplementowanego algorytmu numerycznego, możemy jej używać następująco:
std::cout<< ::integrate(sin,0,3.1415926,0.01)<<std::endl;
Jest to standardowy sposób implementowania takich zagadnień w C czy w Fortranie. W C++ szablony dają nam większe możliwości. Funkcja integrate przyjmuje jako swój pierwszy argument wskaźnik do jednoargumentowej funkcji zwracającej double, ale to co jest naprawdę istotne to to, że można użyć w stosunku do niego notacji wywołania funkcji: f(x). W C++ możemy wyposażyć w tę możliwość każdą klasę poprzez zdefiniowanie w niej metody operator(). Jeśli zdefiniujemy funkcję integrate jako szablon, to będziemy mieli możliwość przekazywania również takich obiektów nazywanych obiektami funkcyjnymi lub funktorami.
template<typename F> double integrate(F f,double min,double max,double ds) { double integral=.0; for(double x=min;x<max;x+=ds) { integral+=f(x); } return integral*ds; }
( Źródło: integrate_temp.cpp)
Wywołanie
std::cout<< ::integrate(sin,0,3.1415926,0.01)<<std::endl;
dalej zadziała, ale można używać również:
class sina { double _a; public: sina(double a): _a(a) {}; double operator()(double x) {return sin(_a*x);} }; std::cout<< ::integrate(sina(0),0,3.1415926,0.01)<<std::endl; std::cout<< ::integrate(sina(1),0,3.1415926,0.01)<<std::endl; std::cout<< ::integrate(sina(2),0,3.1415926,0.01)<<std::endl;
( Źródło: integrate_temp.cpp)
Widać tu już pierwszą zaletę funktorów: jako obiekty mogą one posiadać stan. W przypadku funkcji do takich celów musielibyśmy używać zmiennych globalnych. Ale żeby móc funktora używać musimy go najpierw zdefiniować. Pytanie na które bedę się starał odpowiedzieć na tym wykładzie brzmi: czy możemy definicję funktora uprościć? Np. czy nie moglibyśmy pisać
integrate(sin(2*x),...)
lub
integrate(1.0/(1.0+x),...)
Okazuje się, że można i technika, która to umożliwia, nosi nazwę "szablonów wyrażeń". Z pozoru wydaje się to być tylko ciekawostką, ale w następnej części tego wykładu pokażemy jak za pomocą tej techniki można istotnie przyspieszyć program.
Naszym celem jest napisane kodu, który będzie generował funktory
automatycznie z "normalnych" wyrażeń typu \(\displaystyle 1/(1+x)\) i umożliwi pisanie wyrażeń w rodzaju:
integrate(1/(1+x),0,1,0.01);
\(\displaystyle x\) oznacza tu zmienną, po której całkujemy. Oznacza to, że kompilator musi wyrażenie \(\displaystyle 1/(1+x)\) przekształcić na funktor
class _some_functor_ { public: double operator()(double x) return {1/(1+x);} }
Chińczycy mówią, że podróż stumilową zaczyna się od pierwszego kroku. Zróbmy więc pierwszy krok i spróbujmy doprowadzić do prawidłowej kompilacji i wykonania wyrażenie:
integrate(x,...);
Żeby to działało prawidłowo, x musi być funktorem który zwraca własny argument:
class Variable { public: double operator()(double x) { return x; } };
( Źródło: expr_templates.h)
Możemy więc już wykonać całkę \(\displaystyle \int_0^1x\;\) d \(\displaystyle x\)
Variable x; integrate(x,0,1,0.001);
co nie jest jakimś porywającym wyczynem:). Żeby się posunąć dalej potrzebujemy kolejnych elementów.
Ewidentnie potrzebujemy stałych (literałów). Stała to funktor, który zwraca wartość niezależną od swojego argumentu:
class Constant { double _c; public: Constant(double c) :_c(c){}; double operator()(double x) {return _c;} };
( Źródło: expr_templates.h)
Niestety literałów nie możemy używać bezpośrednio w naszym wyrażeniu:
integrate(1.0,0,1,0.001);
nie zadziała. Musimy pisać
integrate(Constant(1.0),0,1,0.001);
Można by wprawdzie przeładować definicje integrate dla argumentów typu double ale chyba nie warto, zważywszy na to, że całkowanie stałej nie jest zbyt kłopotliwe.
Następnym krokiem będzie dodanie wyrażeń arytmetycznych.
Zaczniemy od dodawania. Potrzebne będą dwa elementy: klasa funktor, która symbolizuje dodawanie oraz odpowiednio zdefiniowany operator dodawania.
Funktor symbolizujący dodawanie musi mieć dwie składowe odpowiadające dwu składnikom tej operacji. Przypominamy, że każdy z tych składników też jest funktorem, a więc posiada jednoargmentowy operator()(double). Operacja dodawania polegać więc bedzie na dodaniu wyników obu funktorów składowych:
template<typename LHS,typename RHS > class AddExpr { LHS _lhs; RHS _rhs; public: AddExpr(const LHS &l,const RHS &r) :_lhs(l),_rhs(r) {}; double operator()(double x) { return _lhs(x)+_rhs(x); } };
( Źródło: expr_templates.h)
Pozostaje nam tylko zdefiniować operator dodawania, który z dwu składników utworzy nam obiekt typu AddExpr. Ponieważ możemy dodawać cokolwiek, to operator dodawania będzie szablonem:
template<typename LHS,typename RHS > Add<LHS,RHS> operator+(const LHS &l, const RHS &r) { return Add<LHS,RHS>(l,r); };
( Źródło: expr_templates.h)
Żeby móc dodawać stałe potrzebujemy jeszcze specjalizacji szablonu dla przypadku, w którym jeden z argumentów jest typu double):
template<typename LHS > Add<LHS,Constant> operator+(const LHS &l, double r) { return Add<LHS,Constant>(l,Constant(r)); }; template<typename RHS > Add<Constant,RHS> operator+(double l, const RHS &r) { return Add<Constant,RHS>(Constant(l),r); };
( Źródło: expr_templates.h)
Widać, że w identyczny sposób możemy zaimplementować pozostałe trzy działania. Odpowiadające im klasy nazwiemy odpowiednio SubsExpr, MultExpr i DivExpr (pominąłem jednoargumentowy operator-()). Ich kod można zaobaczyć w Źródło: expr_templates.h.
Analogicznie implementujemy funkcje np.:
template<typename Arg> class SinExpr{ Arg _arg; public: SinExpr(const Arg& arg) :_arg(arg) {}; double operator()(double x) {return sin(_arg(x));} }; template<typename Arg> SinExpr<Arg> sin(const Arg&a) { return SinExpr<Arg>(a);}
i operatory unarne (jednoargumentowe), takie jak operator negacji:
template<typename LHS> class NegativeExpr { LHS _lhs; public: NegativeExpr(const LHS &l) :_lhs(l) {}; double operator()(double x) { return - _lhs(x); } }; template<typename LHS> NegativeExpr<LHS> operator-(const LHS &l) { return NegativeExpr<LHS>(l); };
( Źródło: expr_templates.h)
Mam nadzieję, że zasada działania szablonów wyrażeń jest już jasna, ale prześledźmy jeszcze raz przykład wyrażenia:
\Variable x; 1.0/(1.0+x)
Kompilator dokonuje rozkładu gramatycznego i interpretuje to wyrażenia jako:
operator/(1.0,operator+(1,x))
Wiedząc, że x jest typu Variable, kompilator stara się znaleźć
odpowiednie szablony operatorów. Najpierw dopasuje wewnętrzny
operator+
operator/(double,operator+<Variable>(double 1.0 , Variable x))
a potem wiedząć, że typ zwracany przez ten operator
to AddExpr
operator/<AddExpr<Constant,Variable> > (double 1.0, AddExpr<Constant,Variable> operator+<Variable>(double 1.0 , Variable x) )
Po zastąpieniu skonkretyzowanych operatorów ich definicjami powstanie kod, który generuje tymczasowy obiekt:
expr=DivExpression<Constant, AddExpr<Constant,Variable> >(Constant(1.0), AddExpr<Constant,Variable>(Constant(1.0),Variable() );
Przedstawienie tego obiektu zamieszczone jest na rysunku 9.1.
Widać, że obiekt expr reprezentuje drzewo rozkładu wyrażenia \(\displaystyle 1.0/(1.0+x)\). Wywołanie operatora nawiasów spowoduje rekurencyjne wywoływanie operatorów nawiasów wyrażeń składowych i w konsekwencji obliczenie tego wyrażenia.
Proszę zwrócić uwagę, że opisana technika szablonów wyrażeń składa się z dwóch części. Pierwsza to klasy reprezentujące wyrażenia: Constant,Variable,AddExpr, itd., za pomocą których budujemy drzewo rozkładu gramatycznego. Druga - to przeciążone operatory i funkcje, które to drzewo generują.
W przedstawionym przykładzie ograniczyliśmy się do wyrażeń typu double. W duchu programowania uogólnionego postaramy się zmienić nasz kod tak, aby można było wybierać typ wyrażenia poprzez parametr szablonu.
Okazuje się to jednak nie tak proste. Łatwo jest dodać dodatkowy parametr do klas reprezentujących wyrażenia:
template<typename T> class Variable { public: T operator()(T x) { return x; } }; template<typename T> class Constant { T _c; public: Constant(T c) :_c(c){}; T operator()(T x) {return _c;} }; template<typename T, typename LHS,typename RHS > class AddExpr { LHS _lhs; RHS _rhs; public: AddExpr(const LHS &l,const RHS &r) :_lhs(l),_rhs(r) {}; T operator()(T x) { return _lhs(x)+_rhs(x); } };
ale niestety operatory arytmetyczne nie będą miały jak automatycznie wydedukować typu T.
template<typename T,typename LHS,typename RHS > Add<T,LHS,RHS> operator+(const LHS &l, const RHS &r) { return Add<T,LHS,RHS>(l,r); };
Typ T nie pojawia się w argumentach wywołania, a więc nie może być wydedukowany. Mamy więć kłopot.
Rozwiązaniem może być dodanie dodatkowej klasy Expr "opakowującej" wyrażenia, która będzie przenosiła informację o typie:
template<typename T,typename R = Variable<T> > class Expr { R _rep; public: Expr() {}; Expr(R rep):_rep(rep) {}; T operator()(T x) {return _rep(x);} R rep() const {return _rep;}; };
( Źródło: expr_templates_T.h)
Odpowiednie operatory dodawania będą teraz wyglądały następująco:
template<typename T,typename LHS,typename RHS > Expr<T,AddExpr<T,LHS,RHS> > operator+(const Expr<T,LHS> &l, const Expr<T,RHS> &r) { return Expr<T,AddExpr<T,LHS,RHS> >(AddExpr<T,LHS,RHS>(l.rep(),r.rep())); }; template<typename T,typename LHS > Expr<T,AddExpr<T,LHS,Constant<T> > > operator+(const Expr<T,LHS> &l, T r) { return Expr<T,AddExpr<T,LHS,Constant<T> > > (AddExpr<T,LHS,Constant<T> >(l.rep(),Constant<T>(r))); };
Ponieważ teraz typ T pojawia się w argumentach wywołania, jest możliwa jego dedukcja. Pełna implementacja wszystkich operatorów znajduje się w Źródło: expr_templates_T.h.
W porównaniu z poprzednią implementacją jedyna zmiana to taka, że zmienne musimy teraz deklarować jako:
Expr<double> x;
lub równoważnie
Expr<double,Variable<double> > x;
Teraz możemy również definiować zmienne innych typów:
Expr<complex<double> > z; Expr<int> i;
Niestety, to ciągle nie jest koniec naszych kłopotów, nie możemy bowiem mieszać wyrażeń różnych typów. Jeśli np. zdefiniujemy:
Expr<double> x;
int i;
to wyrażenia
x+1;
x+i;
nieskompilują się. Oczywiście możemy pisać:
x+1.0; x+(double)i;
ale jest to niewygodne; zwłaszcza jeśli będziemy chcieli użyć zmiennych zespolonych
Expr<std::complex<double> > c; double x; std::complex<double>(x)+c
wydaje się trochę skomplikowane. Można jednak, używając cech promocji, tak zmodyfikować nasz kod, aby potrafił automatycznie konwertować typy. Jest to przedmiotem jednego z ćwiczeń do tego wykładu.
Jak na razie generowaliśmy funktory jednoargumentowe. Powyższa technika daje się łatwo zastosować również do funktorów dwuargumentowych. W tym celu musimy mieć możność rozróżnienia pierwszego i drugiego argumentu. Dlatego wprawadzamy dwie klasy, które zastąpią klasę Variable. Klasa
class First { public: double operator()(double x) { return x; } double operator()(double x,double) { return x; } };
reprezentuje pierwszy argument i może występować w funktorach jedno- lub dwuargumentowych, więc ma dwa operatory nawiasów. Klasa
class Second { public: double operator()(double,double y) { return y; } };
reprezentuje drugi argument funktora, więc może występować tylko jako funkcja dwuargumentowa, stąd tylko jeden dwuargumentowy operator nawiasów. Podobnie klasa
class Constant { double _c; public: Constant(double c) :_c(c){}; double operator()(double) {return _c;} double operator()(double,double) {return _c;} };
dorobiła się drugiego operatora nawiasów. Ostatnia zmiana to dodanie dwuargumentowego operatora nawiasów dla klasy
template<typename LHS,typename RHS > class AddExpr { LHS _lhs; RHS _rhs; public: AddExpr(const LHS &l,const RHS &r) :_lhs(l),_rhs(r) {}; double operator()(double x) { return _lhs(x)+_rhs(x); } double operator()(double x,double y) { return _lhs(x,y)+_rhs(x,y); } };
I podobnie dla reszty działań. Operatory pozostają bez zmian.
Jako przykład zastosowania opisanych (lub podobnych) technik może służyć biblioteka lambda z repozytorium boost. Korzystając z tej biblioteki możemy używać predefiniowanych zmiennych _1, _2 i _3, które oznaczają odpowiednio pierwszy, drugi i trzeci argument. Korzystając z nich możemy przyklad z wykładu 2.6.3 zapisać następująco:
std::generate_n(v.begin(),n,SequenceGen<int>(1,2)); std::vector<int>::iterator it=find_if(v.begin(),v.end(),_1>4); std::cout<<*it<<std::endl;
Wszystko to piękne, ale po co? Używając wyrażeń szablonowych zyskujemy być może na wygodzie, ale dzieje się to kosztem znacznego skomplikowania kodu, a co za tym idzie - czasu kompilacji. Kod jest również dużo trudniejszy do zdebugowania. Powyższy przykład ma głównie walor edukacyjny. Teraz pokażę jak tę technikę można zastosować do problemu, w którym daje ona istotne korzyści.
Rozważmy w tym celu kolejny typowy przykład wykorzystania C++. Przeładowywanie operatorów pozwala nam prosto rozszerzyć język o operacje wektorowe. Implementacja np. operatora dodawania dla dwóch wektorów mogłaby wyglądać następująco:
template<typename T> vector<T> operator+(const vector<T> &lhs, const vector<T> &rhs) { vector<T> res(lhs) ; for(size_t i=0;i<rhs.size();++i) res[i]+=rhs[i]; return res; }
Potrzebne są jeszcze przeładowane wersje tego operatora, w których jeden z argumentów jest double-em. Zakładając, że zdefiniujemy pozostałe potrzebne operatory, możemy teraz pisać kod tak jakby typy wektorowe i operacje na nich były wbudowane w język (to zresztą było jednym z kryteriów przy projektowaniu C++):
vector<double> v1(100,1); vector<double> v2(100,2); vector<double> res(100); res=1.2*v1+v1*v2+v2*0.5; [cpp] <p>Niestety, powyższy kod traci wiele przy bliższej analizie. Jeśli popatrzymy na definicję operatorów, to zauważymy, że ta linijka w rzeczywistości generuje coś takiego: </p> [cpp] vector<double> tmp1(100); tmp1=0.5*v2; vector<double> tmp2(100); tmp2=v1*v2; vector<double> tmp3(100); tmp3=tmp1+tmp2 vector<double> tmp4(100); tmp4=1.2*v1; vector<double> tmp5(100); tmp5=tmp3+tmp4; res=tmp5
Tworzymy pięć(!) tymczasowych wektorów (przydzielając na nie pamięć!) i sześć razy kopiujemy wektory!! Pisząc ten sam kod ręcznie napisalibyśmy:
for(int i=0;i<100;i++) res[i]=1.2*v1[i]+v1[i]*v2[i]+v2[i]*.5;
Niepotrzebny jest żaden obiekt tymczasowy i tylko jedno kopiowanie. Ponadto można liczyć, że kompilator lepiej zoptymalizuje tak prosty kod np. eliminując jedno mnożenie:
for(int i=0;i<100;i++) res[i]=v1[i]*(1.2+v2[i])+v2[i]*.5;
Te dodatkowe niepotrzebne kopiowania i tymczasowe obiekty stanowią duży narzut, a co za tym idzie mocno ograniczją użyteczność tego typu bibliotek, a to wielka szkoda. Na ratunek przychodzą nam opisane wcześniej szablony wyrażeń. Jak widzieliśmy w poprzednim wykładzie, korzystając z tej techniki najpierw tworzymy reprezentację wyrażenia, a dopiero potem ją wykonujemy. Postaramy się więc napisać kod, który będzie tworzył reprezentację wyrażeń wektorowych, a dopiero potem obliczał je w jednej ostatniej pętli, generowanej przez operator przypisania. Podobnie jak w poprzednim przykładzie kod będzie prostszy jeśli ograniczymy się do wektorów jednego typu (double).
Zaczynamy więc od zdefiniowania nowej klasy Vector. Nie możemy użyć std::vector bezpośrednio, bo potrzebujemy przeładować operator przypisania, ale możemy wykorzystać std::vector do implementacji naszej klasy, np. korzystając z dziedziczenia:
class Vector : public vector<double> { public: Vector():vector<double>(){}; Vector(int n):vector<double>(n){}; Vector(int n,double x):vector<double>(n,x){}; Vector(const Vector& v):vector<double>(static_cast<vector<double> >(v)){}; Vector(const vector<double>& v):vector<double>(v) {}; Vector &operator=(const Vector& rhs) { vector<double>::operator=(static_cast<vector<double> >(rhs)); } template<typename V> Vector &operator=(const V &rhs) { for(size_t i =0 ;i<vector<double>::size();++i) (*this)[i]=rhs[i]; return *this; } };
Dziedziczymy cały interfejs z std::vector ale musimy zdefiniować własne konstruktory. Definiujemy też nowy operator przypisania. Korzystając z szablonów możemy uczynić argumentem operatora przypisania jakiekolwiek wyrażenie, które posiada operator indeksowania. Implementacja klasy Vector nie jest istotna jak długo posiada operator indeksowania i szablon operatora przypisania.
Podobnie jak poprzednio, potrzebne jeszcze będzie wyrażenie reprezentujące skalar, który zachowuje sie jak wektor o wszystkich polach takich samych:
class Const_vector { double _c; public: Const_vector(double c):_c(c) {}; double operator[](int i) const {return _c;} };
Następnie definiujemy wyrażenie reprezentujace sumę dwóch wektorów:
template<typename LHS,typename RHS> class AddVectors { const LHS &_lhs; /* bład ! */ const RHS &_rhs; /* bład ! */ public: AddVectors(const LHS &lhs,const RHS &rhs): _lhs(lhs),_rhs(rhs){}; double operator[](int i) const {return _lhs[i]+_rhs[i];} };
Proszę zwrócić uwagę, że pola _lhs i _rhs są referencjami. Gdyby tak nie było inicjalizacja klasy wymagałaby kopiowania i stracilibyśmy cały zysk. Niestety, to nie jest jeszcze poprawna implementacja. Żeby to zauważyć przyjrzyjmy sie operatorowi dodawania:
template<typename LHS,typename RHS> inline AddVectors<LHS,RHS> operator+(const LHS &lhs,const RHS &rhs) { return AddVectors<LHS,RHS>(lhs,rhs); }
a dokładniej - tej jego wersji, w której jeden z argmentów jest typu double:
template<typename LHS> inline AddVectors<LHS,Const_vector> operator+(const LHS &lhs,double rhs) { return AddVectors<LHS,Const_vector>(lhs,Const_vector(rhs) ); }
i symetryczny.
W takim przypadku operator+(...) tworzy tymczasowy obiekt typu
Const_vector, który przekazuje do konstruktora
AddVectors
template<typename T> struct V_expr_traits { typedef T const & op_type; } ; template<> struct V_expr_traits<Const_vector> { typedef Const_vector op_type; } ;
za pomocą której definiujemy pola składowe AddVectors jako:
typename V_expr_traits<LHS>::op_type _lhs; typename V_expr_traits<RHS>::op_type _rhs;
Pomijając te aspekty, widać więc, że implementacja jest całkowicie analogiczna do przykładu z funktorami, tyle że operator nawiasów został zastąpiony operatorem indeksowania. Zakładając, że zaimplementujemy pozostałe klasy i operatory to kompilator z wyrażenia
v1*(1.2+v2)+v2*.5;
stworzy nam obiekt przestawiony na rysunku 9.2.
Dopiero próba przypisania tego obiektu do wektora res spowoduje wywołanie w pętli operatora indeksowania dla tego obiektu, co pociągnie za sobą efektywnie obliczenie wyrażenia
for(int i=0;i<n;++i) res[i]=v1[i]*(1.2+v2[i])+v2[i]*.5;
zgodnie z naszymi zamiarami.
Aby sprawdzić jak działa to w praktyce, porównałem czas wykonania wyrażenia
v1*(1.2+v2)+v2*.5;
korzystając ze "zwykłej" implementacji operatorów arytmetycznych i z szablonów wyrażeń. Pomiaru dokonywałem poprzez umieszczenie tego wyrażenia w pętli:
Vector v1(100,1); Vector v2(100,2); Vector res(100); for(size_t j = 0;j< 10000000;++j){ res=1.2*v1+v1*v2+v2*0.5; f(res); }
Czas wykonania programu mierzyłem poleceniem systemowym time. Wyniki są następujace (w sekundach):
zwykłe | szablony | |
-O0 | 720 | 311 |
-O1 | 36 | 6.3 |
-O2 | 30 | 5.5 |
-O3 | 30 | 5.5 |
Proszę zauważyć, że znów włączanie optymalizacji daje dramatyczny 20 - 50-krotny wzrost szybkości programu. Podkreślam raz jeszcze, że opcja -O0, czyli brak optymalizacji, jest domyślną opcją dla kompilatora g++. Widać też, że używanie szablonów wyrażeń daje pięciokrotny wzrost szybkości programu. Oczywiście ten wynik będzie silnie zależał od konkretnych zastosowań. Jak zwykle gorąco zachęcam do własnych eksperymentów.
Załącznik | Wielkość |
---|---|
Integrate.cpp | 311 bajtów |
Integrate_temp.cpp | 638 bajtów |
Expr_templates.h | 3.72 KB |
Expr_templates_T.h | 4.2 KB |