IFEM/matrix_8h_source.html

 // $Id$

 //==============================================================================

 //==============================================================================


 #ifndef UTL_MATRIX_H

 #define UTL_MATRIX_H


 #include <vector>

 #include <iostream>

 #include <algorithm>

 #include <cstring>

 #include <cctype>

 #include <cmath>

 #include "BLAS.h"

 #include "print_tol.h"


 #ifdef INDEX_CHECK

 #if INDEX_CHECK > 1

 #define ABORT_ON_INDEX_CHECK abort()

 #else

 #define ABORT_ON_INDEX_CHECK

 #endif

 #define CHECK_INDEX(label,i,n) if (i < 1 || i > n) { \

     std::cerr << label << i <<" is out of range [1,"<< n <<"]"<< std::endl; \

     ABORT_ON_INDEX_CHECK; }

 #else

 #define CHECK_INDEX(label,i,n)

 #define ABORT_ON_INDEX_CHECK

 #endif


 #ifdef SING_CHECK

 #define ABORT_ON_SINGULARITY abort()

 #else

 #define ABORT_ON_SINGULARITY

 #endif


 namespace utl

 {

   const char RETAIN = 2;


   template<class T> class vector

   {

   public:

     vector() {}

     explicit vector(size_t n) { this->resize(n); }

     vector(const T* values, size_t n) { this->fill(values,n); }

     vector(const std::vector<T>& X) : myVec(X) {}


     vector<T>& operator=(const std::vector<T>& X)

     {

       myVec = X;

       return *this;

     }


     T* ptr() { return myVec.empty() ? nullptr : myVec.data(); }

     const T* ptr() const { return myVec.empty() ? nullptr : myVec.data(); }


     size_t size() const { return myVec.size(); }

     bool empty() const { return myVec.empty(); }

     bool zero(T tol = T(0)) const

     {

       return std::all_of(myVec.begin(), myVec.end(),

                          [tol](T v) { return std::fabs(v) <= tol; });

     }


     using ConstVecIter = typename std::vector<T>::const_iterator;

     using VecIter      = typename std::vector<T>::iterator;


     ConstVecIter begin() const { return myVec.begin(); }

     ConstVecIter end() const { return myVec.end(); }

     VecIter begin(){ return myVec.begin(); }

     VecIter end() { return myVec.end(); }


     operator const std::vector<T>&() const { return myVec; }

     operator std::vector<T>&() { return myVec; }


     T& operator[](size_t i) { return myVec[i]; }

     const T& operator[](size_t i) const { return myVec[i]; }


     T& operator()(size_t i)

     {

       CHECK_INDEX("vector::operator(): Index ",i,myVec.size());

       return myVec[i-1];

     }


     const T& operator()(size_t i) const

     {

       CHECK_INDEX("vector::operator(): Index ",i,myVec.size());

       return myVec[i-1];

     }


     void fill(T s) { std::fill(myVec.begin(),myVec.end(),s); }

     void fill(const T* values, size_t n = 0)

     {

       if (n > myVec.size())

         myVec.resize(n);

       memcpy(myVec.data(),values,myVec.size()*sizeof(T));

     }


     void push_back(T c) { myVec.push_back(c); }


     void push_back(ConstVecIter i1, ConstVecIter i2)

     {

       myVec.insert(myVec.end(),i1,i2);

     }


     void push_back(const T* p, const T* q) { myVec.insert(myVec.end(),p,q); }


     void swap(vector<T>& vec) { myVec.swap(vec.myVec); }


     vector<T>& operator*=(T c);

     vector<T>& operator/=(T d) { return this->operator*=(T(1)/d); }


     vector<T>& operator*=(const std::vector<T>& X)

     {

       for (size_t i = 0; i < myVec.size() && i < X.size(); i++)

         myVec[i] *= X[i];

       return *this;

     }

     vector<T>& operator/=(const std::vector<T>& X)

     {

       for (size_t i = 0; i < myVec.size() && i < X.size(); i++)

         myVec[i] *= (X[i] == T(0) ? T(0) : T(1)/X[i]);

       return *this;

     }


     vector<T>& operator+=(const vector<T>& X) { return this->add(X); }

     vector<T>& operator-=(const vector<T>& X) { return this->add(X,T(-1)); }

     vector<T>& add(const std::vector<T>& X, const T& alfa = T(1),

                    unsigned int ofsx = 0, int stridex = 1,

                    unsigned int ofsy = 0, int stridey = 1);


     vector<T>& relax(T alfa, const std::vector<T>& X)

     {

       if (alfa != T(1))

       {

         this->operator*=(alfa);

         this->add(X,T(1)-alfa);

       }

       return *this;

     }

     vector<T>& relax(T alfa, const std::vector<T>& X, const std::vector<T>& Y)

     {

       return this->operator=(Y).relax(alfa,X);

     }


     T dot(const T* v, size_t nv,

           size_t off1 = 0, int inc1 = 1,

           size_t off2 = 0, int inc2 = 1) const;


     T dot(const std::vector<T>& v,

           size_t off1 = 0, int inc1 = 1,

           size_t off2 = 0, int inc2 = 1) const

     {

       return this->dot(v.data(),v.size(),off1,inc1,off2,inc2);

     }


     T norm2(size_t off = 0, int inc = 1) const;

     T normInf(size_t& off, int inc = 1, bool sign = false) const;

     T normInf(int inc = 1) const { size_t o = 0; return this->normInf(o,inc); }


     T max() const { return *std::max_element(myVec.begin(),myVec.end()); }

     T min() const { return *std::min_element(myVec.begin(),myVec.end()); }


     T asum(size_t off = 0, int inc = 1) const;


     T sum(size_t off = 0, int inc = 1, size_t max = 0) const

     {

       T xsum = T(0);

       if (inc < 1 || myVec.empty())

         return xsum;


       if (max == 0 || max > myVec.size())

         max = myVec.size();

       for (size_t i = off; i < max; i += inc)

         xsum += myVec[i];

       return xsum;

     }


     bool resize(size_t n, char forceClear = 0)

     {

       if (n == myVec.size())

       {

         if (forceClear == 1)

           this->fill(T(0)); // Erase previous content

         return false; // Size is not changed

       }


       if (forceClear < RETAIN)

         myVec.clear();

       myVec.resize(n,T(0));

       return true;

     }


     void reserve(size_t n) { myVec.reserve(n); }

     void clear() { myVec.clear(); }


   private:

     std::vector<T> myVec;

   };


   template<class T> class matrixBase

   {

   protected:

     matrixBase() : n{0,0,0,0}, elem(myElem) {}

     explicit matrixBase(vector<T>& vec) : n{0,0,0,0}, elem(vec) {}

     matrixBase(size_t n_1, size_t n_2, size_t n_3 = 1, size_t n_4 = 1)

       : n{n_1,n_2,n_3,n_4}, elem(myElem), myElem(n_1*n_2*n_3*n_4) {}


     matrixBase(const matrixBase<T>& mat, bool copyContent = true)

       : elem(myElem), myElem(mat.size())

     {

       memcpy(n,mat.n,sizeof(n));

       if (copyContent)

         elem = mat.elem;

     }


     void redim(size_t n_1, size_t n_2, size_t n_3, size_t n_4, bool forceClear)

     {

       if (forceClear)

       {

         // Erase previous content

         if (this->size() == n_1*n_2*n_3*n_4)

           this->fill(T(0));

         else

           this->clear();

       }


       if (n[0] == n_1 && n[1] == n_2 && n[2] == n_3 && n[3] == n_4)

         return; // nothing to do


       size_t oldn1 = n[0];

       size_t oldn2 = n[1];

       size_t oldn3 = n[2];

       size_t oldSize = this->size();

       n[0] = n_1;

       n[1] = n_2;

       n[2] = n_3;

       n[3] = n_4;

       if (this->size() == oldSize)

         return; // no more to do, size is unchanged


       // If the size in any of the matrix dimensions, except for the last one,

       // are changed the previous matrix content must be cleared

       if (!forceClear)

         this->clearIfNrowChanged(oldn1,oldn2,oldn3);


       elem.resize(n[0]*n[1]*n[2]*n[3],RETAIN);

     }


     virtual void clearIfNrowChanged(size_t n1, size_t n2, size_t n3) = 0;


   public:

     size_t dim(short int d = 1) const { return d > 0 && d <= 4 ? n[d-1] : 0; }

     size_t size() const { return n[0]*n[1]*n[2]*n[3]; }

     bool empty() const { return elem.empty(); }

     bool zero(T tol = T(0)) const { return elem.zero(tol); }


     const vector<T>& toVec() const { return elem; }

     operator const std::vector<T>&() const { return elem; }

     operator std::vector<T>&() { return elem; }


     T* ptr(size_t c = 0)

     {

       return n[0]*c < elem.size() ? elem.ptr() + n[0]*c : nullptr;

     }

     const T* ptr(size_t c = 0) const

     {

       return n[0]*c < elem.size() ? elem.ptr() + n[0]*c : nullptr;

     }


     typename std::vector<T>::iterator begin() { return elem.begin(); }

     typename std::vector<T>::iterator end() { return elem.end(); }


     void clear() { n[0] = n[1] = n[2] = n[3] = 0; elem.clear(); }


     void fill(T s) { std::fill(elem.begin(),elem.end(),s); }

     void fill(const T* values, size_t n = 0) { elem.fill(values,n); }


     matrixBase<T>& add(const matrixBase<T>& A, const T& alfa);

     matrixBase<T>& multiply(const T& c);


     T norm2(int inc = 1) const { return elem.norm2(0,inc); }

     T asum(int inc = 1) const { return elem.asum(0,inc); }

     T sum(int inc = 1) const

     {

       if (inc > 0)

         return elem.sum(0,inc);

       else if (inc == 0 || (inc *= -1) > static_cast<int>(n[1]))

         return T(0);

       else

         return elem.sum((inc-1)*n[0],1,inc*n[0]);

     }


   protected:

     size_t     n[4];

     vector<T>& elem;


   private:

     vector<T> myElem;

   };


   template<class T> class matrix : public matrixBase<T>

   {

   public:

     matrix() : nrow(this->n[0]), ncol(this->n[1]) {}

     explicit matrix(vector<T>& vec)

       : matrixBase<T>(vec), nrow(this->n[0]), ncol(this->n[1]) {}

     matrix(size_t r, size_t c)

       : matrixBase<T>(r,c), nrow(this->n[0]), ncol(this->n[1]) {}

     matrix(const matrix<T>& mat, bool transposed = false)

       : matrixBase<T>(mat,false), nrow(this->n[0]), ncol(this->n[1])

     {

       nrow = transposed ? mat.ncol : mat.nrow;

       ncol = transposed ? mat.nrow : mat.ncol;

       if (transposed)

         for (size_t r = 0; r < ncol; r++)

           for (size_t c = 0; c < nrow; c++)

             this->elem[c+nrow*r] = mat.elem[r+ncol*c];

       else if (!mat.elem.empty())

         this->elem.fill(mat.elem.ptr());

     }

     virtual ~matrix() {}


     void resize(size_t r, size_t c, bool forceClear = false)

     {

       this->redim(r,c,1,1,forceClear);

     }


     matrix<T>& expandRows(int incRows)

     {

       int newRows = nrow + incRows;

       if (newRows < 1 || ncol < 1)

         // The matrix is empty

         this->clear();

       else if (incRows < 0)

       {

         // The matrix size is reduced

         T* newMat = this->ptr() + newRows;

         for (size_t c = 1; c < ncol; c++, newMat += newRows)

           memmove(newMat,this->ptr(c),newRows*sizeof(T));

         nrow = newRows;

         this->elem.resize(nrow*ncol,RETAIN);

       }

       else if (incRows > 0)

       {

         // The matrix size is increased

         size_t oldRows = nrow;

         nrow = newRows;

         this->elem.resize(nrow*ncol,RETAIN);

         T* oldMat = this->ptr() + oldRows*(ncol-1);

         for (size_t c = ncol-1; c > 0; c--, oldMat -= oldRows)

         {

           memmove(this->ptr(c),oldMat,oldRows*sizeof(T));

           for (size_t r = nrow-1; r >= oldRows; r--)

             this->elem[r+nrow*(c-1)] = T(0);

         }

       }

       return *this;

     }


     bool augmentRows(const matrix<T>& B)

     {

       if (B.ncol != ncol)

         return false;


       size_t oldRows = nrow;

       nrow += B.nrow;

       this->elem.resize(nrow*ncol,RETAIN);

       T* oldMat = this->ptr() + oldRows*(ncol-1);

       for (size_t c = ncol; c > 0; c--, oldMat -= oldRows)

       {

         if (c > 1)

           memmove(this->ptr(c-1),oldMat,oldRows*sizeof(T));

         for (size_t r = nrow; r > oldRows; r--)

           this->elem[r-1+nrow*(c-1)] = B(r-oldRows,c);

       }

       return true;

     }


     bool augmentCols(const matrix<T>& B)

     {

       if (B.nrow != nrow)

         return false;


       this->elem.push_back(B.elem.begin(),B.elem.end());

       ncol += B.ncol;

       return true;

     }


     size_t rows() const { return nrow; }

     size_t cols() const { return ncol; }


     matrix<T>& operator=(const matrix<T>& A)

     {

       if (&A == this)

         return *this;


       memcpy(this->n,A.n,sizeof(A.n));

       this->elem = A.elem;

       return *this;

     }


     matrix<T>& operator=(const std::vector<T>& X)

     {

       // Do not use vector<T>::operator= because we don't want to alter size

       size_t nval = X.size() < this->elem.size() ? X.size() : this->elem.size();

       std::copy(X.begin(),X.begin()+nval,this->elem.begin());

       std::fill(this->elem.begin()+nval,this->elem.end(),T(0));

       return *this;

     }


     T& operator()(size_t r, size_t c)

     {

       CHECK_INDEX("matrix::operator(): Row-index ",r,nrow);

       CHECK_INDEX("matrix::operator(): Column-index ",c,ncol);

       return this->elem[r-1+nrow*(c-1)];

     }


     const T& operator()(size_t r, size_t c) const

     {

       CHECK_INDEX("matrix::operator(): Row-index ",r,nrow);

       CHECK_INDEX("matrix::operator(): Column-index ",c,ncol);

       return this->elem[r-1+nrow*(c-1)];

     }


     vector<T> getRow(size_t r) const

     {

       CHECK_INDEX("matrix::getRow: Row-index ",r,nrow);

       if (nrow < 2)

         return this->elem;


       vector<T> row(ncol);

       for (size_t i = 0; i < ncol; i++)

         row[i] = this->elem[r-1+nrow*i];

       return row;

     }


     std::vector<T> getColumn(size_t c) const

     {

       CHECK_INDEX("matrix::getColumn: Column-index ",c,ncol);

       if (ncol < 2)

         return this->elem;


       std::vector<T> col(nrow);

       memcpy(col.data(),this->ptr(c-1),nrow*sizeof(T));

       return col;

     }


     using matrixBase<T>::fill;

     void fill(const std::vector<T>& v, size_t n, size_t m = 0)

     {

       if (n == 0 || v.size() < n)

         return;

       if (m == 0) m = v.size()/n;

       this->resize(n,m,true);

       if (n*m == v.size())

         this->elem.fill(v.data());

       else if ((n = v.size()/m) > nrow)

         for (size_t c = 0; c < ncol; c++)

           this->fillColumn(c+1,v.data()+c*n);

       else // n < nrow

         for (size_t c = 0; c < ncol; c++)

           for (size_t r = 0; r < n; r++)

             this->elem[r+c*nrow] = v[r+c*n];

     }


     void fillColumn(size_t c, const std::vector<T>& data)

     {

       CHECK_INDEX("matrix::fillColumn: Column-index ",c,ncol);

       size_t ndata = nrow > data.size() ? data.size() : nrow;

       memcpy(this->ptr(c-1),data.data(),ndata*sizeof(T));

     }


     void fillColumn(size_t c, const T* data)

     {

       CHECK_INDEX("matrix::fillColumn: Column-index ",c,ncol);

       memcpy(this->ptr(c-1),data,nrow*sizeof(T));

     }


     void fillRow(size_t r, const T* data)

     {

       CHECK_INDEX("matrix::fillRow: Row-index ",r,nrow);

       if (nrow < 2)

         this->elem.fill(data);

       else for (size_t i = 0; i < ncol; i++)

         this->elem[r-1+nrow*i] = data[i];

     }


     void fillBlock(const matrix<T>& block, size_t r, size_t c,

                    bool transposed = false)

     {

       size_t nr = transposed ? block.cols() : block.rows();

       size_t nc = transposed ? block.rows() : block.cols();

       for (size_t i = 1; i <= nr && i+r-1 <= nrow; i++)

       {

         size_t ip = i+r-2 + nrow*(c-1);

         for (size_t j = 1; j <= nc && j+c-1 <= ncol; j++, ip += nrow)

           this->elem[ip] = transposed ? block(j,i) : block(i,j);

       }

     }


     void addBlock(const matrix<T>& block, T s, size_t r, size_t c,

                   bool transposed = false)

     {

       size_t nr = transposed ? block.cols() : block.rows();

       size_t nc = transposed ? block.rows() : block.cols();

       for (size_t i = 1; i <= nr && i+r-1 <= nrow; i++)

       {

         size_t ip = i+r-2 + nrow*(c-1);

         for (size_t j = 1; j <= nc && j+c-1 <= ncol; j++, ip += nrow)

           this->elem[ip] += s*(transposed ? block(j,i) : block(i,j));

       }

     }


     void extractBlock(matrix<T>& block, size_t r, size_t c,

                       bool addTo = false, bool transposed = false) const

     {

       size_t nr = transposed ? block.cols() : block.rows();

       size_t nc = transposed ? block.rows() : block.cols();

       for (size_t i = 1; i <= nr && i+r-1 <= nrow; i++)

       {

         size_t ip = i+r-2 + nrow*(c-1);

         for (size_t j = 1; j <= nc && j+c-1 <= ncol; j++, ip += nrow)

           if (addTo)

             (transposed ? block(j,i) : block(i,j)) += this->elem[ip];

           else

             (transposed ? block(j,i) : block(i,j)) = this->elem[ip];

       }

     }


     matrix<T>& diag(T d, size_t dim = 0)

     {

       if (dim > 0)

         this->resize(dim,dim,true);

       else

         this->resize(nrow,ncol,true);

       for (size_t r = 0; r < nrow && r < ncol; r++)

         this->elem[r+nrow*r] = d;

       return *this;

     }


     matrix<T>& transpose()

     {

       matrix<T> tmp(*this);

       for (size_t r = 0; r < nrow; r++)

         for (size_t c = 0; c < ncol; c++)

           this->elem[c+ncol*r] = tmp.elem[r+nrow*c];


       nrow = tmp.ncol;

       ncol = tmp.nrow;

       return *this;

     }


     T trace() const { return this->elem.sum(0,nrow+1); }

     T rowsum(size_t r) const { return this->elem.sum(r-1,nrow); }

     T colsum(size_t c) const { return this->elem.sum(nrow*(c-1),1,nrow*c); }


 #define THIS(i,j) this->operator()(i,j)


     T det() const

     {

       if (ncol == 1 && nrow >= 1)

         return THIS(1,1);

       else if (ncol == 2 && nrow >= 2)

         return THIS(1,1)*THIS(2,2) - THIS(2,1)*THIS(1,2);

       else if (ncol == 3 && nrow >= 3)

         return THIS(1,1)*(THIS(2,2)*THIS(3,3) - THIS(3,2)*THIS(2,3))

           -    THIS(1,2)*(THIS(2,1)*THIS(3,3) - THIS(3,1)*THIS(2,3))

           +    THIS(1,3)*(THIS(2,1)*THIS(3,2) - THIS(3,1)*THIS(2,2));

       else if (ncol > 0 && nrow > 0) {

         std::cerr <<"matrix::det: Not available for "

                   << nrow <<"x"<< ncol <<" matrices"<< std::endl;

         ABORT_ON_SINGULARITY;

         return T(-999);

       }

       else

         return T(0);

     }


     T inverse(T tol = T(0))

     {

       T Det = this->det();

       if (Det == T(-999))

         return Det;

       else if (Det <= tol && Det >= -tol) {

         std::cerr <<"matrix::inverse: Singular matrix |A|="<< Det << std::endl;

         ABORT_ON_SINGULARITY;

         return T(0);

       }


       if (ncol == 1)

         THIS(1,1) = T(1) / Det;

       else if (ncol == 2) {

         matrix<T> B(2,2);

         B(1,1) =  THIS(2,2) / Det;

         B(2,1) = -THIS(2,1) / Det;

         B(1,2) = -THIS(1,2) / Det;

         B(2,2) =  THIS(1,1) / Det;

         *this = B;

       }

       else if (ncol == 3) {

         matrix<T> B(3,3);

         B(1,1) =  (THIS(2,2)*THIS(3,3) - THIS(3,2)*THIS(2,3)) / Det;

         B(2,1) = -(THIS(2,1)*THIS(3,3) - THIS(3,1)*THIS(2,3)) / Det;

         B(3,1) =  (THIS(2,1)*THIS(3,2) - THIS(3,1)*THIS(2,2)) / Det;

         B(1,2) = -(THIS(1,2)*THIS(3,3) - THIS(3,2)*THIS(1,3)) / Det;

         B(2,2) =  (THIS(1,1)*THIS(3,3) - THIS(3,1)*THIS(1,3)) / Det;

         B(3,2) = -(THIS(1,1)*THIS(3,2) - THIS(3,1)*THIS(1,2)) / Det;

         B(1,3) =  (THIS(1,2)*THIS(2,3) - THIS(2,2)*THIS(1,3)) / Det;

         B(2,3) = -(THIS(1,1)*THIS(2,3) - THIS(2,1)*THIS(1,3)) / Det;

         B(3,3) =  (THIS(1,1)*THIS(2,2) - THIS(2,1)*THIS(1,2)) / Det;

         *this = B;

       }


       return Det;

     }


     bool isSymmetric(T tol = T(0)) const

     {

       if (nrow != ncol)

         return false;


       for (size_t r = 0; r < nrow; r++)

         for (size_t c = 0; c < r; c++)

         {

           T diff = this->elem[r+nrow*c] - this->elem[c+nrow*r];

           if (diff < -tol || diff > tol)

             return false;

         }


       return true;

     }


     matrix<T>& operator+=(const matrix<T>& A) { return this->add(A); }

     matrix<T>& operator-=(const matrix<T>& A) { return this->add(A,T(-1)); }

     matrix<T>& add(const matrix<T>& A, T alfa = T(1))

     {

       return static_cast<matrix<T>&>(this->matrixBase<T>::add(A,alfa));

     }


     matrix<T>& operator*=(T c) { return this->multiply(c); }

     matrix<T>& operator/=(T d) { return this->multiply(T(1)/d); }

     matrix<T>& multiply(T c)

     {

       return static_cast<matrix<T>&>(this->matrixBase<T>::multiply(c));

     }


     matrix<T>& multiply(const matrix<T>& A, const matrix<T>& B,

                         bool transA = false, bool transB = false,

                         bool addTo = false, const T& alpha = T(1));


     bool multiplyMat(const matrix<T>& A, const std::vector<T>& B,

                      bool transA = false, bool addTo = false);


     bool multiplyMat(const std::vector<T>& A, const matrix<T>& B,

                      bool transB = false, bool addTo = false);


     bool multiply(const std::vector<T>& X, std::vector<T>& Y,

                   bool transA = false, char addTo = 0) const;


     bool multiply(const std::vector<T>& X, std::vector<T>& Y,

                   const T& alpha, const T& beta = T(0),

                   bool transA = false, int stridex = 1, int stridey = 1,

                   unsigned int ofsx = 0, unsigned int ofsy = 0) const;


     bool outer_product(const std::vector<T>& X, const std::vector<T>& Y,

                        bool addTo = false, T alpha = T(1));


     T normInf() const

     {

       if (nrow == 0)

         return T(0);


       // Compute row sums

       vector<T> sums(nrow);

       for (size_t i = 0; i < nrow; i++)

         sums[i] = this->elem.asum(i,nrow);

       return *std::max_element(sums.begin(),sums.end());

     }


   private:

     bool compatible(const std::vector<T>& X, bool transA) const

     {

       if (nrow > 0 && ncol > 0)

         if ((transA ? nrow : ncol) == X.size())

           return true;


       std::cerr <<"matrix::multiply: Incompatible matrices: A("

                 << nrow <<','<< ncol <<"), X("<< X.size() <<")\n"

                 <<"                  when computing Y = "

                 << (transA ? "A^t":"A") <<" * X"<< std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     bool compatible(const matrix<T>& A, const matrix<T>& B,

                     bool transA, bool transB, size_t& M, size_t& N, size_t& K)

     {

       M = transA ? A.ncol : A.nrow;

       N = transB ? B.nrow : B.ncol;

       K = transA ? A.nrow : A.ncol;

       if (K == (transB ? B.ncol : B.nrow))

         return true;


       std::cerr <<"matrix::multiply: Incompatible matrices: A("

                 << A.nrow <<','<< A.ncol <<"), B("

                 << B.nrow <<','<< B.ncol <<")\n"

                 <<"                  when computing C = "

                 << (transA ? "A^t":"A") <<" * "

                 << (transB ? "B^t":"B") << std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     bool compatible(const matrix<T>& A, const std::vector<T>& B,

                     bool transA, size_t& M, size_t& N, size_t& K)

     {

       M = transA ? A.ncol : A.nrow;

       K = transA ? A.nrow : A.ncol;

       N = K > 0 ? B.size()/K : 0;

       if (N*K == B.size() && !B.empty())

         return true;


       std::cerr <<"matrix::multiply: Incompatible matrices: A("

                 << A.nrow <<','<< A.ncol <<"), B(r*c="<< B.size() <<")\n"

                 <<"                  when computing C = "

                 << (transA ? "A^t":"A") <<" * B"<< std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     bool compatible(const std::vector<T>& A, const matrix<T>& B,

                     bool transB, size_t& M, size_t& N, size_t& K)

     {

       N = transB ? B.nrow : B.ncol;

       K = transB ? B.ncol : B.nrow;

       M = K > 0 ? A.size() / K : 0;

       if (M*K == A.size() && !A.empty())

         return true;


       std::cerr <<"matrix::multiply: Incompatible matrices: A(r*c="<< A.size()

                 <<"), B("<< B.nrow <<","<< B.ncol <<")\n"

                 <<"                  when computing C = A * "

                 << (transB ? "B^t":"B") << std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     bool compatible(const std::vector<T>& X, const std::vector<T>& Y)

     {

       if (X.size() == nrow && Y.size() == ncol)

         return true;


       std::cerr <<"matrix::outer_product: Incompatible matrix and vectors: A("

                 << nrow <<','<< ncol <<"), X("

                 << X.size() <<"), Y("<< Y.size() <<")\n"

                 <<"                       when computing A += X*Y^t"

                 << std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


   protected:

     void clearIfNrowChanged(size_t n1, size_t, size_t) override

     {

       if (n1 != nrow) this->elem.clear();

     }


   private:

     size_t& nrow;

     size_t& ncol;

   };


 #ifdef HAS_BLAS

   //============================================================================

   //===   BLAS-implementation of the matrix/vector multiplication methods   ====

   //============================================================================


   template<> inline

   vector<float>& vector<float>::operator*=(float c)

   {

     cblas_sscal(myVec.size(),c,myVec.data(),1);

     return *this;

   }


   template<> inline

   vector<double>& vector<double>::operator*=(double c)

   {

     cblas_dscal(myVec.size(),c,myVec.data(),1);

     return *this;

   }


   template<> inline

   float vector<float>::dot(const float* v, size_t nv,

                            size_t o1, int i1, size_t o2, int i2) const

   {

     int n1 = i1 > 1 || i1 < -1 ? myVec.size()/abs(i1) : myVec.size()-o1;

     int n2 = i2 > 1 || i2 < -1 ? nv/abs(i2) : nv-o2;

     int n  = n1 < n2 ? n1 : n2;

     return cblas_sdot(n,myVec.data()+o1,i1,v+o2,i2);

   }


   template<> inline

   double vector<double>::dot(const double* v, size_t nv,

                              size_t o1, int i1, size_t o2, int i2) const

   {

     int n1 = i1 > 1 || i1 < -1 ? myVec.size()/abs(i1) : myVec.size()-o1;

     int n2 = i2 > 1 || i2 < -1 ? nv/abs(i2) : nv-o2;

     int n  = n1 < n2 ? n1 : n2;

     return cblas_ddot(n,myVec.data()+o1,i1,v+o2,i2);

   }


   template<> inline

   float vector<float>::norm2(size_t off, int inc) const

   {

     int n = inc > 1 || inc < -1 ? myVec.size()/abs(inc) : myVec.size()-off;

     return cblas_snrm2(n,myVec.data()+off,inc);

   }


   template<> inline

   double vector<double>::norm2(size_t off, int inc) const

   {

     int n = inc > 1 || inc < -1 ? myVec.size()/abs(inc) : myVec.size()-off;

     return cblas_dnrm2(n,myVec.data()+off,inc);

   }


   template<> inline

   float vector<float>::normInf(size_t& off, int inc, bool sign) const

   {

     if (inc < 1 || myVec.empty())

       return 0.0f;


     const float* v = myVec.data() + off;

     off = 1 + cblas_isamax(myVec.size()/inc,v,inc);

     return sign ? v[(off-1)*inc] : fabsf(v[(off-1)*inc]);

   }


   template<> inline

   double vector<double>::normInf(size_t& off, int inc, bool sign) const

   {

     if (inc < 1 || myVec.empty())

       return 0.0;


     const double* v = myVec.data() + off;

     off = 1 + cblas_idamax(myVec.size()/inc,v,inc);

     return sign ? v[(off-1)*inc] : fabs(v[(off-1)*inc]);

   }


   template<> inline

   float vector<float>::asum(size_t off, int inc) const

   {

     int n = inc > 1 || inc < -1 ? myVec.size()/abs(inc) : myVec.size()-off;

     return cblas_sasum(n,myVec.data()+off,inc);

   }


   template<> inline

   double vector<double>::asum(size_t off, int inc) const

   {

     int n = inc > 1 || inc < -1 ? myVec.size()/abs(inc) : myVec.size()-off;

     return cblas_dasum(n,myVec.data()+off,inc);

   }


   template<> inline

   vector<float>& vector<float>::add(const std::vector<float>& X,

                                     const float& alfa,

                                     unsigned int ofsx, int stridex,

                                     unsigned int ofsy, int stridey)

   {

     if (myVec.empty() && stridex > 0 && stridey > 0)

       myVec.resize(ofsy+stridey*(X.size()-ofsx)/stridex);


     int nx = stridex == 0 ? 1 : 1 +     (X.size()-ofsx-1)/abs(stridex);

     int ny = stridey == 0 ? 1 : 1 + (myVec.size()-ofsy-1)/abs(stridey);

     int n = nx < ny ? (stridex == 0 ? ny : nx) : (stridey == 0 ? nx : ny);

     if (n > 0)

       cblas_saxpy(n,alfa,X.data()+ofsx,stridex,myVec.data()+ofsy,stridey);

     return *this;

   }


   template<> inline

   vector<double>& vector<double>::add(const std::vector<double>& X,

                                       const double& alfa,

                                       unsigned int ofsx, int stridex,

                                       unsigned int ofsy, int stridey)

   {

     if (myVec.empty() && stridex > 0 && stridey > 0)

       myVec.resize(ofsy+stridey*(X.size()-ofsx)/stridex);


     int nx = stridex == 0 ? 1 : 1 +     (X.size()-ofsx-1)/abs(stridex);

     int ny = stridey == 0 ? 1 : 1 + (myVec.size()-ofsy-1)/abs(stridey);

     int n = nx < ny ? (stridex == 0 ? ny : nx) : (stridey == 0 ? nx : ny);

     if (n > 0)

       cblas_daxpy(n,alfa,X.data()+ofsx,stridex,myVec.data()+ofsy,stridey);

     return *this;

   }


   template<> inline

   matrixBase<float>& matrixBase<float>::add(const matrixBase<float>& A,

                                             const float& alfa)

   {

     int n = this->size() < A.size() ? this->size() : A.size();

     if (n > 0)

       cblas_saxpy(n,alfa,A.ptr(),1,this->ptr(),1);

     return *this;

   }


   template<> inline

   matrixBase<double>& matrixBase<double>::add(const matrixBase<double>& A,

                                               const double& alfa)

   {

     int n = this->size() < A.size() ? this->size() : A.size();

     if (n > 0)

       cblas_daxpy(n,alfa,A.ptr(),1,this->ptr(),1);

     return *this;

   }


   template<> inline

   matrixBase<float>& matrixBase<float>::multiply(const float& c)

   {

     cblas_sscal(this->size(),c,this->ptr(),1);

     return *this;

   }


   template<> inline

   matrixBase<double>& matrixBase<double>::multiply(const double& c)

   {

     cblas_dscal(this->size(),c,this->ptr(),1);

     return *this;

   }


   template<> inline

   bool matrix<float>::multiply(const std::vector<float>& X,

                                std::vector<float>& Y,

                                bool transA, char addTo) const

   {

     if (!this->compatible(X,transA))

       return false;

     else if (!addTo || Y.empty())

     {

       Y.resize(transA ? ncol : nrow);

       if (addTo) std::fill(Y.begin(),Y.end(),0.0f);

     }


     cblas_sgemv(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans,

                 nrow, ncol, addTo < 0 ? -1.0f : 1.0f,

                 this->ptr(), nrow,

                 X.data(), 1, addTo ? 1.0f : 0.0f,

                 Y.data(), 1);


     return true;

   }


   template<> inline

   bool matrix<double>::multiply(const std::vector<double>& X,

                                 std::vector<double>& Y,

                                 bool transA, char addTo) const

   {

     if (!this->compatible(X,transA))

       return false;

     else if (!addTo || Y.empty())

     {

       Y.resize(transA ? ncol : nrow);

       if (addTo) std::fill(Y.begin(),Y.end(),0.0);

     }


     cblas_dgemv(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans,

                 nrow, ncol, addTo < 0 ? -1.0 : 1.0,

                 this->ptr(), nrow,

                 X.data(), 1, addTo ? 1.0 : 0.0,

                 Y.data(), 1);


     return true;

   }


   template<> inline

   bool matrix<float>::multiply(const std::vector<float>& X,

                                std::vector<float>& Y,

                                const float& alpha, const float& beta,

                                bool transA, int stridex, int stridey,

                                unsigned int ofsx, unsigned int ofsy) const

   {

     if (stridex == 0 || stridey == 0)

     {

       std::cerr <<"matrix::multiply: Stride must be non-zero ("

                 << stridex <<", "<< stridey <<")"<< std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     if (ofsx == 0 && stridex == 1 && !this->compatible(X,transA))

       return false;

     else if (beta == 0.0f || Y.empty())

     {

       Y.resize(ofsy + 1 + ((transA ? ncol : nrow)-1)*abs(stridey));

       if (beta != 0.0f) std::fill(Y.begin(),Y.end(),0.0f);

     }


     cblas_sgemv(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans,

                 nrow, ncol, alpha,

                 this->ptr(), nrow,

                 X.data()+ofsx, stridex, beta,

                 Y.data()+ofsy, stridey);


     return true;

   }


   template<> inline

   bool matrix<double>::multiply(const std::vector<double>& X,

                                 std::vector<double>& Y,

                                 const double& alpha, const double& beta,

                                 bool transA, int stridex, int stridey,

                                 unsigned int ofsx, unsigned int ofsy) const

   {

     if (stridex == 0 || stridey == 0)

     {

       std::cerr <<"matrix::multiply: Stride must be non-zero ("

                 << stridex <<", "<< stridey <<")"<< std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     if (ofsx == 0 && stridex == 1 && !this->compatible(X,transA))

       return false;

     else if (beta == 0.0 || Y.empty())

     {

       Y.resize(ofsy + 1 + ((transA ? ncol : nrow)-1)*abs(stridey));

       if (beta != 0.0) std::fill(Y.begin(),Y.end(),0.0);

     }


     cblas_dgemv(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans,

                 nrow, ncol, alpha,

                 this->ptr(), nrow,

                 X.data()+ofsx, stridex, beta,

                 Y.data()+ofsy, stridey);


     return true;

   }


   template<> inline

   matrix<float>& matrix<float>::multiply(const matrix<float>& A,

                                          const matrix<float>& B,

                                          bool transA, bool transB,

                                          bool addTo, const float& alpha)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transA,transB,M,N,K))

     {

       this->clear();

       return *this;

     }

     else if (!addTo || this->empty())

       this->resize(M,N);


     cblas_sgemm(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans,

                 transB ? CblasTrans : CblasNoTrans,

                 M, N, K, alpha,

                 A.ptr(), A.nrow,

                 B.ptr(), B.nrow,

                 addTo ? 1.0f : 0.0f,

                 this->ptr(), nrow);


     return *this;

   }


   template<> inline

   matrix<double>& matrix<double>::multiply(const matrix<double>& A,

                                            const matrix<double>& B,

                                            bool transA, bool transB,

                                            bool addTo, const double& alpha)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transA,transB,M,N,K))

     {

       this->clear();

       return *this;

     }

     else if (!addTo || this->empty())

       this->resize(M,N);


     cblas_dgemm(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans,

                 transB ? CblasTrans : CblasNoTrans,

                 M, N, K, alpha,

                 A.ptr(), A.nrow,

                 B.ptr(), B.nrow,

                 addTo ? 1.0 : 0.0,

                 this->ptr(), nrow);


     return *this;

   }


   template<> inline

   bool matrix<float>::multiplyMat(const matrix<float>& A,

                                   const std::vector<float>& B,

                                   bool transA, bool addTo)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transA,M,N,K))

       return false;

     else if (!addTo || this->empty())

       this->resize(M,N);


     cblas_sgemm(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans, CblasNoTrans,

                 M, N, K, 1.0f,

                 A.ptr(), A.nrow,

                 B.data(), K,

                 addTo ? 1.0f : 0.0f,

                 this->ptr(), nrow);


     return true;

   }


   template<> inline

   bool matrix<double>::multiplyMat(const matrix<double>& A,

                                    const std::vector<double>& B,

                                    bool transA, bool addTo)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transA,M,N,K))

       return false;

     else if (!addTo || this->empty())

       this->resize(M,N);


     cblas_dgemm(CblasColMajor,

                 transA ? CblasTrans : CblasNoTrans, CblasNoTrans,

                 M, N, K, 1.0,

                 A.ptr(), A.nrow,

                 B.data(), K,

                 addTo ? 1.0 : 0.0,

                 this->ptr(), nrow);


     return true;

   }


   template<> inline

   bool matrix<float>::multiplyMat(const std::vector<float>& A,

                                   const matrix<float>& B,

                                   bool transB, bool addTo)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transB,M,N,K))

       return false;

     else if (!addTo || this->empty())

       this->resize(M,N);


     cblas_sgemm(CblasColMajor,

                 CblasNoTrans, transB ? CblasTrans : CblasNoTrans,

                 M, N, K, 1.0f,

                 A.data(), M,

                 B.ptr(), B.nrow,

                 addTo ? 1.0f : 0.0f,

                 this->ptr(), nrow);


     return true;

   }


   template<> inline

   bool matrix<double>::multiplyMat(const std::vector<double>& A,

                                    const matrix<double>& B,

                                    bool transB, bool addTo)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transB,M,N,K))

       return false;

     else if (!addTo || this->empty())

       this->resize(M,N);


     cblas_dgemm(CblasColMajor,

                 CblasNoTrans, transB ? CblasTrans : CblasNoTrans,

                 M, N, K, 1.0,

                 A.data(), M,

                 B.ptr(), B.nrow,

                 addTo ? 1.0 : 0.0,

                 this->ptr(), nrow);


     return true;

   }


   template<> inline

   bool matrix<float>::outer_product(const std::vector<float>& X,

                                     const std::vector<float>& Y,

                                     bool addTo, float alpha)

   {

     if (!addTo)

       this->resize(X.size(),Y.size());

     else if (!this->compatible(X,Y))

       return false;


     cblas_sgemm(CblasColMajor,

                 CblasNoTrans, CblasTrans,

                 nrow, ncol, 1, alpha,

                 X.data(), nrow,

                 Y.data(), ncol,

                 addTo ? 1.0f : 0.0f,

                 this->ptr(), nrow);


     return true;

   }


   template<> inline

   bool matrix<double>::outer_product(const std::vector<double>& X,

                                      const std::vector<double>& Y,

                                      bool addTo, double alpha)

   {

     if (!addTo)

       this->resize(X.size(),Y.size());

     else if (!this->compatible(X,Y))

       return false;


     cblas_dgemm(CblasColMajor,

                 CblasNoTrans, CblasTrans,

                 nrow, ncol, 1, alpha,

                 X.data(), nrow,

                 Y.data(), ncol,

                 addTo ? 1.0 : 0.0,

                 this->ptr(), nrow);


     return true;

   }


 #else

   //============================================================================

   //===   Non-BLAS inlined implementations (slow...)   =========================

   //============================================================================


   template<class T> inline

   vector<T>& vector<T>::operator*=(T c)

   {

     for (T& x : myVec)

       x *= c;

     return *this;

   }


   template<class T> inline

   T vector<T>::dot(const T* v, size_t nv,

                    size_t o1, int i1, size_t o2, int i2) const

   {

     size_t i, j;

     T dotprod = T(0);

     for (i = o1, j = o2; i < myVec.size() && j < nv; i += i1, j += i2)

       dotprod += myVec[i] * v[j];

     return dotprod;

   }


   template<class T> inline

   T vector<T>::norm2(size_t off, int inc) const

   {

     double xsum = 0.0;

     if (inc < 1 || myVec.size() <= off)

       return xsum;


     // Warning: This might overflow or underflow for large/small values

     for (size_t i = off; i < myVec.size(); i += inc)

       xsum += myVec[i]*myVec[i];

     return sqrt(xsum);

   }


   template<class T> inline

   T vector<T>::normInf(size_t& off, int inc, bool sign) const

   {

     T xmax = T(0);

     if (inc < 1 || myVec.size() <= off)

       return xmax;


     T amax = T(0);

     for (size_t i = off; i < myVec.size(); i += inc)

       if (myVec[i] > amax)

       {

         off = 1+i/inc;

         xmax = amax = myVec[i];

       }

       else if (myVec[i] < -amax)

       {

         off = 1+i/inc;

         xmax = myVec[i];

         amax = -xmax;

       }


     return sign ? xmax : amax;

   }


   template<class T> inline

   T vector<T>::asum(size_t off, int inc) const

   {

     T xsum = T(0);

     if (inc < 1 || myVec.size() <= off)

       return xsum;


     for (size_t i = off; i < myVec.size(); i += inc)

       xsum += myVec[i] < T(0) ? -myVec[i] : myVec[i];

     return xsum;

   }


   template<class T> inline

   vector<T>& vector<T>::add(const std::vector<T>& X, const T& alfa,

                             unsigned int ofsx, int stridex,

                             unsigned int ofsy, int stridey)

   {

     if (stridex < 0 || stridey < 0 || stridex+stridey == 0)

     {

       std::cerr <<"vector::add: Negative stride not supported ("

                 << stridex <<", "<< stridey <<")"<< std::endl;

       ABORT_ON_INDEX_CHECK;

       return *this;

     }


     std::vector<T>& Y = myVec;

     if (Y.empty() && stridex > 0)

       Y.resize(ofsy+stridey*(X.size()-ofsx)/stridex);


     for (; ofsx < X.size() && ofsy < Y.size(); ofsx += stridex, ofsy += stridey)

       Y[ofsy] += alfa*X[ofsx];

     return *this;

   }


   template<class T> inline

   matrixBase<T>& matrixBase<T>::add(const matrixBase<T>& A, const T& alfa)

   {

     const vector<T>& X = A.elem;

     vector<T>& Y = this->elem;


     for (size_t i = 0; i < X.size() && i < Y.size(); i++)

       Y[i] += alfa*X[i];

     return *this;

   }


   template<class T> inline

   matrixBase<T>& matrixBase<T>::multiply(const T& c)

   {

     for (T& x : this->elem)

       x *= c;

     return *this;

   }


   template<class T> inline

   bool matrix<T>::multiply(const std::vector<T>& X, std::vector<T>& Y,

                            bool transA, char addTo) const

   {

     if (!this->compatible(X,transA))

       return false;

     else if (!addTo || Y.empty())

     {

       Y.resize(transA ? ncol : nrow);

       std::fill(Y.begin(),Y.end(),T(0));

     }


     for (size_t i = 0; i < Y.size(); i++)

       for (size_t j = 0; j < X.size(); j++)

         if (transA)

           Y[i] += THIS(j+1,i+1) * (addTo < 0 ? -X[j] : X[j]);

         else

           Y[i] += THIS(i+1,j+1) * (addTo < 0 ? -X[j] : X[j]);


     return true;

   }


   template<class T> inline

   bool matrix<T>::multiply(const std::vector<T>& X, std::vector<T>& Y,

                            const T& alpha, const T& beta,

                            bool transA, int stridex, int stridey,

                            unsigned int ofsx, unsigned int ofsy) const

   {

     if (stridex <= 0 || stridey <= 0)

     {

       std::cerr <<"matrix::multiply: Non-positive stride not supported ("

                 << stridex <<", "<< stridey <<")"<< std::endl;

       ABORT_ON_INDEX_CHECK;

       return false;

     }


     if (ofsx == 0 && stridex == 1 && !this->compatible(X,transA))

       return false;

     else if (beta == T(0) || Y.empty())

     {

       Y.resize(ofsy + 1 + ((transA ? ncol : nrow)-1)*stridey);

       std::fill(Y.begin(),Y.end(),T(0));

     }

     else if (beta != T(1))

       for (size_t i = ofsy; i < Y.size(); i += stridey)

         Y[i] *= beta;


     size_t a, b, i, j;

     for (a = 1, i = ofsy; i < Y.size(); a++, i += stridey)

       for (b = 1, j = ofsx; j < X.size(); b++, j += stridex)

         if (transA)

           Y[i] += alpha * THIS(b,a) * X[j];

         else

           Y[i] += alpha * THIS(a,b) * X[j];


     return true;

   }


   template<class T> inline

   matrix<T>& matrix<T>::multiply(const matrix<T>& A,

                                  const matrix<T>& B,

                                  bool transA, bool transB, bool addTo,

                                  const T& alpha)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transA,transB,M,N,K))

     {

       this->clear();

       return *this;

     }

     else if (!addTo || this->empty())

       this->resize(M,N,true);


     for (size_t i = 1; i <= M; i++)

       for (size_t j = 1; j <= N; j++)

         for (size_t k = 1; k <= K; k++)

           if (transA && transB)

             THIS(i,j) += alpha*A(k,i)*B(j,k);

           else if (transA)

             THIS(i,j) += alpha*A(k,i)*B(k,j);

           else if (transB)

             THIS(i,j) += alpha*A(i,k)*B(j,k);

           else

             THIS(i,j) += alpha*A(i,k)*B(k,j);


     return *this;

   }


   template<class T> inline

   bool matrix<T>::multiplyMat(const matrix<T>& A, const std::vector<T>& B,

                               bool transA, bool addTo)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transA,M,N,K))

       return false;

     else if (!addTo || this->empty())

       this->resize(M,N,true);


     for (size_t i = 1; i <= M; i++)

       for (size_t j = 1; j <= N; j++)

         for (size_t k = 1; k <= K; k++)

           if (transA)

             THIS(i,j) += A(k,i)*B[k-1+K*(j-1)];

           else

             THIS(i,j) += A(i,k)*B[k-1+K*(j-1)];


     return true;

   }


   template<class T> inline

   bool matrix<T>::multiplyMat(const std::vector<T>& A, const matrix<T>& B,

                               bool transB, bool addTo)

   {

     size_t M, N, K;

     if (!this->compatible(A,B,transB,M,N,K))

       return false;

     else if (!addTo || this->empty())

       this->resize(M,N,true);


     for (size_t i = 1; i <= M; i++)

       for (size_t j = 1; j <= N; j++)

         for (size_t k = 1; k <= K; k++)

           if (transB)

             THIS(i,j) += A[i-1+M*(k-1)]*B(j,k);

           else

             THIS(i,j) += A[i-1+M*(k-1)]*B(k,j);


     return true;

   }


   template<class T> inline

   bool matrix<T>::outer_product(const std::vector<T>& X,

                                 const std::vector<T>& Y,

                                 bool addTo, T alpha)

   {

     if (!addTo)

       this->resize(X.size(),Y.size());

     else if (!this->compatible(X,Y))

       return false;


     if (addTo)

       for (size_t j = 0; j < ncol; j++)

         for (size_t i = 0; i < nrow; i++)

           this->elem[i+nrow*j] += alpha*X[i]*Y[j];

     else

       for (size_t j = 0; j < ncol; j++)

         for (size_t i = 0; i < nrow; i++)

           this->elem[i+nrow*j] = alpha*X[i]*Y[j];


     return true;

   }


 #endif


   //============================================================================

   //===   Global operators   ===================================================

   //============================================================================


   template<class T> inline T trunc(T v)

   {

     return v > T(zero_print_tol) || v < T(-zero_print_tol) || std::isnan(v) ?

            v : T(0);

   }


   template<class T> std::istream& operator>>(std::istream& s, vector<T>& X)

   {

     size_t n = 0;

     s >> n;

     X.resize(n,true);

     for (T& val : X)

       s >> val;

     return s;

   }


   template<class T> std::ostream& operator<<(std::ostream& s,

                                              const vector<T>& X)

   {

     if (X.size() < 1)

       s <<" (empty)";

     else for (size_t i = 0; i < X.size(); i++)

       s << ((i%nval_per_line) ? ' ':'\n') << trunc(X[i]);


     return s << std::endl;

   }


   template<class T> std::istream& operator>>(std::istream& s, matrix<T>& A)

   {

     size_t m = 0, n = 0;

     char c = 0;

     while (s.get(c) && isspace(c));

     bool symmetric = (c == 'S' || c == 's');

     bool columnori = (c == 'C' || c == 'c');

     if (symmetric)

     {

       s.ignore(10,':');

       s >> m;

       n = m;

     }

     else if (isalpha(c))

     {

       s.ignore(15,' ');

       s >> m >> n;

     }

     else

     {

       s.putback(c);

       s >> m >> n;

     }

     A.resize(m,n);

     for (size_t i = 1; i <= m; i++)

     {

       while (s.get(c) && isspace(c));

       if (c == 'R')

         s.ignore(10,':');

       else

         s.putback(c);

       for (size_t j = (symmetric ? i : 1); j <= n; j++)

       {

         s >> (columnori ? A(j,i) : A(i,j));

         if (symmetric && j > i)

           A(j,i) = A(i,j);

       }

     }

     return s;

   }


   template<class T> std::ostream& operator<<(std::ostream& s,

                                              const matrix<T>& A)

   {

     if (A.rows() < 1 || A.cols() < 1)

       return s <<" (empty)"<< std::endl;


     bool symm = A.isSymmetric(zero_print_tol);

     for (size_t i = 1; i <= A.rows(); i++)

     {

       size_t c1 = symm ? i : 1;

       s <<"\nRow "<< i <<": "<< trunc(A(i,c1));

       for (size_t j = c1+1; j <= A.cols(); j++)

         s <<' '<< trunc(A(i,j));

     }


     return s << std::endl;

   }


   template<class T> void writeMatlab(const char* label, const vector<T>& X,

                                      std::ostream& s = std::cout)

   {

     if (label)

       s << label <<" = [";

     else

       s <<"[";


     for (size_t i = 1; i <= X.size(); i++)

       s <<' '<< trunc(X(i));

     s <<" ];"<< std::endl;

   }


   template<class T> void writeMatlab(const char* label, const matrix<T>& A,

                                      std::ostream& s = std::cout)

   {

     if (label)

       s << label <<" = [";

     else

       s <<"[";


     size_t nsp = label ? 4 + strlen(label) : 1;

     for (size_t i = 1; i <= A.rows(); i++)

     {

       if (i > 1)

       {

         s <<";\n";

         for (size_t k = 0; k < nsp; k++) s <<' ';

       }

       for (size_t j = 1; j <= A.cols(); j++)

         s <<' '<< trunc(A(i,j));

     }

     s <<" ];"<< std::endl;

   }

 }


 #undef THIS

 #endif

BLAS.h
BLAS support for various platforms.

K
static SystemMatrix * K
Pointer to coefficient matrix A.
Definition: EigSolver.C:91

M
static SystemMatrix * M
Pointer to coefficient matrix B.
Definition: EigSolver.C:92

SystemMatrix::empty
virtual bool empty() const
Checks if the matrix is empty.
Definition: SystemMatrix.h:249

utl::matrixBase
Common base class for multi-dimensional (2D and 3D) matrices.
Definition: matrix.h:308

utl::matrixBase::n
size_t n[4]
Dimension of the matrix.
Definition: matrix.h:440

utl::matrixBase::dim
size_t dim(short int d=1) const
Query dimensions.
Definition: matrix.h:376

utl::matrixBase::ptr
const T * ptr(size_t c=0) const
Reference through pointer.
Definition: matrix.h:397

utl::matrixBase::add
matrixBase< T > & add(const matrixBase< T > &A, const T &alfa)
Add the given matrix A scaled by alfa to *this.
Definition: matrix.h:1584

utl::matrixBase::matrixBase
matrixBase(vector< T > &vec)
Constructor using an external vector for matrix element storage.
Definition: matrix.h:313

utl::matrixBase::fill
void fill(const T *values, size_t n=0)
Fill the matrix with data from an array.
Definition: matrix.h:413

utl::matrixBase::matrixBase
matrixBase()
The constructor is protected to allow sub-class instances only.
Definition: matrix.h:311

utl::matrixBase::toVec
const vector< T > & toVec() const
Type casting to a one-dimensional utl::vector, for access.
Definition: matrix.h:385

utl::matrixBase::elem
vector< T > & elem
Actual matrix elements, stored column by column.
Definition: matrix.h:441

utl::matrixBase::fill
void fill(T s)
Fill the matrix with a scalar value.
Definition: matrix.h:411

utl::matrixBase::matrixBase
matrixBase(const matrixBase< T > &mat, bool copyContent=true)
Copy constructor.
Definition: matrix.h:322

utl::matrixBase::size
size_t size() const
Query total matrix size.
Definition: matrix.h:378

utl::matrixBase::norm2
T norm2(int inc=1) const
Return the Euclidean norm of the matrix.
Definition: matrix.h:422

utl::matrixBase::clear
void clear()
Clears the matrix and sets its dimension to zero.
Definition: matrix.h:408

utl::matrixBase::ptr
T * ptr(size_t c=0)
Access through pointer.
Definition: matrix.h:392

utl::matrixBase::asum
T asum(int inc=1) const
Return the sum of the absolute value of the matrix elements.
Definition: matrix.h:425

utl::matrixBase::sum
T sum(int inc=1) const
Return the sum of the matrix elements.
Definition: matrix.h:429

utl::matrixBase::empty
bool empty() const
Check if the matrix is empty.
Definition: matrix.h:380

utl::matrixBase::zero
bool zero(T tol=T(0)) const
Check if the matrix elements are all zero.
Definition: matrix.h:382

utl::matrixBase::clearIfNrowChanged
virtual void clearIfNrowChanged(size_t n1, size_t n2, size_t n3)=0
Clears the matrix content if the first dimension(s) changed.

utl::matrixBase::redim
void redim(size_t n_1, size_t n_2, size_t n_3, size_t n_4, bool forceClear)
Resize the matrix to dimension .
Definition: matrix.h:338

utl::matrixBase::matrixBase
matrixBase(size_t n_1, size_t n_2, size_t n_3=1, size_t n_4=1)
Constructor creating a matrix of dimension .
Definition: matrix.h:316

utl::matrixBase::myElem
vector< T > myElem
Internal matrix storage.
Definition: matrix.h:444

utl::matrixBase::multiply
matrixBase< T > & multiply(const T &c)
Multiplication of this matrix by a scalar c.
Definition: matrix.h:1595

utl::matrixBase::begin
std::vector< T >::iterator begin()
Iterator to the start of the matrix elements.
Definition: matrix.h:403

utl::matrixBase::end
std::vector< T >::iterator end()
Iterator to the end of the matrix elements.
Definition: matrix.h:405

utl::matrix
Two-dimensional rectangular matrix with some algebraic operations.
Definition: matrix.h:456

utl::matrix::operator/=
matrix< T > & operator/=(T d)
Division by a scalar.
Definition: matrix.h:842

utl::matrix::cols
size_t cols() const
Query number of matrix columns.
Definition: matrix.h:560

utl::matrix::multiply
bool multiply(const std::vector< T > &X, std::vector< T > &Y, const T &alpha, const T &beta=T(0), bool transA=false, int stridex=1, int stridey=1, unsigned int ofsx=0, unsigned int ofsy=0) const
Matrix-vector multiplication.
Definition: matrix.h:1625

utl::matrix::multiply
bool multiply(const std::vector< T > &X, std::vector< T > &Y, bool transA=false, char addTo=0) const
Matrix-vector multiplication.
Definition: matrix.h:1603

utl::matrix::add
matrix< T > & add(const matrix< T > &A, T alfa=T(1))
Add the given matrix A scaled by alfa to *this.
Definition: matrix.h:834

utl::matrix::trace
T trace() const
Return the trace of the matrix (sum of its diagonal elements).
Definition: matrix.h:741

utl::matrix::operator*=
matrix< T > & operator*=(T c)
Multiplication with a scalar.
Definition: matrix.h:840

utl::matrix::getColumn
std::vector< T > getColumn(size_t c) const
Extract a column from the matrix.
Definition: matrix.h:615

utl::matrix::matrix
matrix(size_t r, size_t c)
Constructor creating a matrix of dimension .
Definition: matrix.h:464

utl::matrix::extractBlock
void extractBlock(matrix< T > &block, size_t r, size_t c, bool addTo=false, bool transposed=false) const
Extract a block of the matrix to another matrix.
Definition: matrix.h:699

utl::matrix::fillRow
void fillRow(size_t r, const T *data)
Fill a row of the matrix.
Definition: matrix.h:661

utl::matrix::clearIfNrowChanged
void clearIfNrowChanged(size_t n1, size_t, size_t) override
Clears the content if the number of rows changed.
Definition: matrix.h:1024

utl::matrix::normInf
T normInf() const
Return the infinite norm of the matrix.
Definition: matrix.h:921

utl::matrix::ncol
size_t & ncol
Number of matrix columns.
Definition: matrix.h:1031

utl::matrix::augmentRows
bool augmentRows(const matrix< T > &B)
Increase the number of rows by augmenting the given matrix.
Definition: matrix.h:527

utl::matrix::augmentCols
bool augmentCols(const matrix< T > &B)
Increase the number of columns by augmenting the given matrix.
Definition: matrix.h:547

utl::matrix::compatible
bool compatible(const std::vector< T > &X, const std::vector< T > &Y)
Check dimension compatibility for outer product multiplication.
Definition: matrix.h:1008

utl::matrix::multiply
matrix< T > & multiply(const matrix< T > &A, const matrix< T > &B, bool transA=false, bool transB=false, bool addTo=false, const T &alpha=T(1))
Matrix-matrix multiplication.
Definition: matrix.h:1661

utl::matrix::multiply
matrix< T > & multiply(T c)
Multiplication of this matrix by a scalar c.
Definition: matrix.h:844

utl::matrix::operator()
T & operator()(size_t r, size_t c)
Index-1 based element access.
Definition: matrix.h:585

utl::matrix::isSymmetric
bool isSymmetric(T tol=T(0)) const
Check for symmetry.
Definition: matrix.h:813

utl::matrix::getRow
vector< T > getRow(size_t r) const
Extract a row from the matrix.
Definition: matrix.h:602

utl::matrix::transpose
matrix< T > & transpose()
Replace the current matrix by its transpose.
Definition: matrix.h:728

utl::matrix::det
T det() const
Compute the determinant of a square matrix.
Definition: matrix.h:750

utl::matrix::operator=
matrix< T > & operator=(const matrix< T > &A)
Assignment operator.
Definition: matrix.h:563

utl::matrix::operator+=
matrix< T > & operator+=(const matrix< T > &A)
Add the given matrix A to *this.
Definition: matrix.h:830

utl::matrix::inverse
T inverse(T tol=T(0))
Compute the inverse of a square matrix.
Definition: matrix.h:773

utl::matrix::fillColumn
void fillColumn(size_t c, const T *data)
Fill a column of the matrix.
Definition: matrix.h:654

utl::matrix::matrix
matrix(const matrix< T > &mat, bool transposed=false)
Copy constructor, optionally creates the transpose of mat.
Definition: matrix.h:467

utl::matrix::fillBlock
void fillBlock(const matrix< T > &block, size_t r, size_t c, bool transposed=false)
Fill a block of the matrix with another matrix.
Definition: matrix.h:671

utl::matrix::compatible
bool compatible(const matrix< T > &A, const matrix< T > &B, bool transA, bool transB, size_t &M, size_t &N, size_t &K)
Check dimension compatibility for matrix-matrix multiplication.
Definition: matrix.h:950

utl::matrix::nrow
size_t & nrow
Number of matrix rows.
Definition: matrix.h:1030

utl::matrix::colsum
T colsum(size_t c) const
Return the sum of a matrix column.
Definition: matrix.h:745

utl::matrix::operator()
const T & operator()(size_t r, size_t c) const
Index-1 based element reference.
Definition: matrix.h:594

utl::matrix::resize
void resize(size_t r, size_t c, bool forceClear=false)
Resize the matrix to dimension .
Definition: matrix.h:488

utl::matrix::rowsum
T rowsum(size_t r) const
Return the sum of a matrix row.
Definition: matrix.h:743

utl::matrix::rows
size_t rows() const
Query number of matrix rows.
Definition: matrix.h:558

utl::matrix::operator-=
matrix< T > & operator-=(const matrix< T > &A)
Subtract the given matrix A from *this.
Definition: matrix.h:832

utl::matrix::~matrix
virtual ~matrix()
Empty destructor.
Definition: matrix.h:480

utl::matrix::matrix
matrix()
Constructor creating an empty matrix.
Definition: matrix.h:459

utl::matrix::addBlock
void addBlock(const matrix< T > &block, T s, size_t r, size_t c, bool transposed=false)
Add a scalar multiple of another matrix to a block of the matrix.
Definition: matrix.h:685

utl::matrix::diag
matrix< T > & diag(T d, size_t dim=0)
Create a diagonal matrix.
Definition: matrix.h:716

utl::matrix::multiplyMat
bool multiplyMat(const std::vector< T > &A, const matrix< T > &B, bool transB=false, bool addTo=false)
Matrix-matrix multiplication.
Definition: matrix.h:1712

utl::matrix::outer_product
bool outer_product(const std::vector< T > &X, const std::vector< T > &Y, bool addTo=false, T alpha=T(1))
Outer product between two vectors.
Definition: matrix.h:1733

utl::matrix::fillColumn
void fillColumn(size_t c, const std::vector< T > &data)
Fill a column of the matrix.
Definition: matrix.h:646

utl::matrix::operator=
matrix< T > & operator=(const std::vector< T > &X)
Overloaded assignment operator.
Definition: matrix.h:574

utl::matrix::multiplyMat
bool multiplyMat(const matrix< T > &A, const std::vector< T > &B, bool transA=false, bool addTo=false)
Matrix-matrix multiplication.
Definition: matrix.h:1691

utl::matrix::matrix
matrix(vector< T > &vec)
Constructor using an external vector for matrix element storage.
Definition: matrix.h:461

utl::matrix::compatible
bool compatible(const std::vector< T > &X, bool transA) const
Check dimension compatibility for matrix-vector multiplication.
Definition: matrix.h:935

utl::matrix::expandRows
matrix< T > & expandRows(int incRows)
Increase or decrease the number of rows in the matrix.
Definition: matrix.h:494

utl::matrix::compatible
bool compatible(const matrix< T > &A, const std::vector< T > &B, bool transA, size_t &M, size_t &N, size_t &K)
Check dimension compatibility for matrix-matrix multiplication, when the matrix B is represented by a...
Definition: matrix.h:971

utl::matrix::fill
void fill(const std::vector< T > &v, size_t n, size_t m=0)
Fill the matrix with vector data.
Definition: matrix.h:628

utl::matrix::compatible
bool compatible(const std::vector< T > &A, const matrix< T > &B, bool transB, size_t &M, size_t &N, size_t &K)
Check dimension compatibility for matrix-matrix multiplication, when the matrix A is represented by a...
Definition: matrix.h:990

utl::vector
A vector class with some added algebraic operations.
Definition: matrix.h:64

utl::vector::begin
VecIter begin()
Start of the vector container, for update.
Definition: matrix.h:108

utl::vector::end
VecIter end()
End of the vector container, for update.
Definition: matrix.h:110

utl::vector::vector
vector()
Constructor creating an empty vector.
Definition: matrix.h:67

utl::vector::vector
vector(const T *values, size_t n)
Constructor creating a vector from a C-array.
Definition: matrix.h:71

utl::vector::operator()
const T & operator()(size_t i) const
Index-1 based element reference.
Definition: matrix.h:130

utl::vector::operator+=
vector< T > & operator+=(const vector< T > &X)
Add the given vector X to *this.
Definition: matrix.h:182

utl::vector::fill
void fill(T s)
Fill the vector with a scalar value.
Definition: matrix.h:137

utl::vector::fill
void fill(const T *values, size_t n=0)
Fill the vector with data from an array.
Definition: matrix.h:139

utl::vector::asum
T asum(size_t off=0, int inc=1) const
Return the sum of the absolute value of the vector elements.
Definition: matrix.h:1550

utl::vector::operator*=
vector< T > & operator*=(const std::vector< T > &X)
Component-wise multiplication with a vector.
Definition: matrix.h:167

utl::vector::max
T max() const
Return the largest element of the vector.
Definition: matrix.h:247

utl::vector::VecIter
typename std::vector< T >::iterator VecIter
Convenience alias for non-const iterators.
Definition: matrix.h:101

utl::vector::push_back
void push_back(T c)
Append a scalar value to the vector, increasing its size by one.
Definition: matrix.h:147

utl::vector::empty
bool empty() const
Is the vector empty (zero size)?
Definition: matrix.h:90

utl::vector::normInf
T normInf(int inc=1) const
Return the infinite norm of the vector (no index offset).
Definition: matrix.h:244

utl::vector::reserve
void reserve(size_t n)
Pre-allocation of vector length to n.
Definition: matrix.h:293

utl::vector::push_back
void push_back(const T *p, const T *q)
Append a range of values increasing the size by q-p.
Definition: matrix.h:156

utl::vector::zero
bool zero(T tol=T(0)) const
Is the vector elements all zero?
Definition: matrix.h:92

utl::vector::operator()
T & operator()(size_t i)
Index-1 based element access.
Definition: matrix.h:123

utl::vector::add
vector< T > & add(const std::vector< T > &X, const T &alfa=T(1), unsigned int ofsx=0, int stridex=1, unsigned int ofsy=0, int stridey=1)
Add the given vector X scaled by alfa to *this.
Definition: matrix.h:1562

utl::vector::operator/=
vector< T > & operator/=(const std::vector< T > &X)
Component-wise division with a vector.
Definition: matrix.h:174

utl::vector::norm2
T norm2(size_t off=0, int inc=1) const
Return the Euclidean norm of the vector.
Definition: matrix.h:1513

utl::vector::begin
ConstVecIter begin() const
Start of the vector container, for access.
Definition: matrix.h:104

utl::vector::swap
void swap(vector< T > &vec)
Swap the content with another vector.
Definition: matrix.h:159

utl::vector::myVec
std::vector< T > myVec
Internal vector storage.
Definition: matrix.h:298

utl::vector::ConstVecIter
typename std::vector< T >::const_iterator ConstVecIter
Convenience alias for const iterators.
Definition: matrix.h:99

utl::vector::relax
vector< T > & relax(T alfa, const std::vector< T > &X, const std::vector< T > &Y)
Perform  where Z = *this.
Definition: matrix.h:203

utl::vector::operator-=
vector< T > & operator-=(const vector< T > &X)
Subtract the given vector X from *this.
Definition: matrix.h:184

utl::vector::operator[]
T & operator[](size_t i)
Index-0 based element access.
Definition: matrix.h:118

utl::vector::end
ConstVecIter end() const
End of the vector container, for access.
Definition: matrix.h:106

utl::vector::operator=
vector< T > & operator=(const std::vector< T > &X)
Overloaded assignment operator.
Definition: matrix.h:76

utl::vector::min
T min() const
Return the smallest element of the vector.
Definition: matrix.h:249

utl::vector::push_back
void push_back(ConstVecIter i1, ConstVecIter i2)
Append a range of values increasing the size by i2-i1.
Definition: matrix.h:150

utl::vector::vector
vector(const std::vector< T > &X)
Overloaded copy constructor.
Definition: matrix.h:73

utl::vector::resize
bool resize(size_t n, char forceClear=0)
Resize the vector to length n.
Definition: matrix.h:277

utl::vector::sum
T sum(size_t off=0, int inc=1, size_t max=0) const
Return the sum of the vector elements.
Definition: matrix.h:260

utl::vector::clear
void clear()
Clear the vector, setting its size to zero.
Definition: matrix.h:295

utl::vector::dot
T dot(const T *v, size_t nv, size_t off1=0, int inc1=1, size_t off2=0, int inc2=1) const
Dot product between *this and another vector.
Definition: matrix.h:1502

utl::vector::operator*=
vector< T > & operator*=(T c)
Multiplication with a scalar.
Definition: matrix.h:1494

utl::vector::relax
vector< T > & relax(T alfa, const std::vector< T > &X)
Perform  where Y = *this.
Definition: matrix.h:192

utl::vector::size
size_t size() const
Size of the vector.
Definition: matrix.h:88

utl::vector::operator/=
vector< T > & operator/=(T d)
Division by a scalar.
Definition: matrix.h:164

utl::vector::operator[]
const T & operator[](size_t i) const
Index-0 based element reference.
Definition: matrix.h:120

utl::vector::normInf
T normInf(size_t &off, int inc=1, bool sign=false) const
Return the infinite norm of the vector, or signed max value.
Definition: matrix.h:1526

utl::vector::vector
vector(size_t n)
Constructor creating a vector of length n.
Definition: matrix.h:69

utl::vector::ptr
const T * ptr() const
Reference through pointer.
Definition: matrix.h:85

utl::vector::ptr
T * ptr()
Access through pointer.
Definition: matrix.h:83

utl::vector::dot
T dot(const std::vector< T > &v, size_t off1=0, int inc1=1, size_t off2=0, int inc2=1) const
Dot product between *this and another vector.
Definition: matrix.h:225

utl
General utility classes and functions.
Definition: SIMoptions.h:22

utl::trunc
T trunc(T v)
Truncate a value to zero when it is less than a given threshold.
Definition: matrix.h:1765

utl::zero_print_tol
double zero_print_tol
Zero tolerance for printing numbers.
Definition: MatVec.C:24

utl::operator<<
std::ostream & operator<<(std::ostream &s, const vector< T > &X)
Print the vector X to the stream s.
Definition: matrix.h:1783

utl::nval_per_line
int nval_per_line
Number of values to print per line.
Definition: MatVec.C:23

utl::RETAIN
const char RETAIN
Flag for vector::resize() method telling it to retain its content.
Definition: matrix.h:55

utl::operator>>
std::istream & operator>>(std::istream &s, vector< T > &X)
Read the vector X from the stream s.
Definition: matrix.h:1772

utl::writeMatlab
void writeMatlab(const char *label, const vector< T > &X, std::ostream &s=std::cout)
Print the vector X to the stream s in matlab format.
Definition: matrix.h:1860

print_tol.h
Global parameters for controlling the print of vectors and matrices.