Change Log: 最后一条关于乘法复杂度的条目有误,已更正。
一、接口怎么设计:
- 是准备只做线性代数矩阵库还是要做n-dimensional array lib (e.g., blitz++)?
- 如果只做矩阵库,向量和矩阵要不要分成不同的class?是干脆就用不同的class还是用继承?是basematrix下面分matrix还是直接用matrix作为基类,向量派生出来?行向量和列向量要不要分开?
- 要不要支持sparse矩阵?
- Dense和sparse矩阵要不要提供统一的接口?要不要采用pimp方式实现还是采用template实现?
- 要不要分别实现raw-major和col-major storage order?是分别以不同的sub-class给出还是用同一个类,但是构造的时候给参数,还是用template parameter给出?
- index操作是采用[][]还是采用operator()(i,j)?
- 对于[][]或者(i,j), const情况下是返回值还是返回&?如果返回&的话,对于sparse matrix怎么处理?对于非const的情况,一般会选择返回&,那么sparse matrix 是不是也返回&?访问0元素的时候怎么办(存在一个修改0元素的问题)?
- 要不要提供各种slice操作?
- 要不要提供各种分块的view?
- 要不要区分ArrayRef和Array?
- 要不要提供iterator?
- 计算效率问题,要不要做/怎么做和lapack/blas的接口?
- 要不要可以reshape, resize?要不要可以扩充列、行?
二、行为设计:
- 要不要提供越界检查?
- 复制的时候是直接复制还是采用copy-on-write?
- 如果试图写入sparse matrix的0值元素,是报错,还是变0值元素为非零值元素?
三、内部实现:
- 如果采用[][]的话第一个[]返回的代理对象怎么设计?
- 如果采用cow,内容如何在handler之间共享?std::shared_ptr还是自己实现一个?
- 要不要用expression template避免不必要的赋值,提高算数运算的效率?(blitz++)
- 经 @D Flip Flop 和 @Curiosity 指正,这一条我可能说错了。据说实践上矩阵乘法就是按照n^3的复杂度实现的,加速通过优化完成。(此条原文:矩阵相乘记得别写成简单粗暴的O(n^3),好像能达到O(n^2.7)?)。