百科问答小站 logo
百科问答小站 font logo



python大型开源项目如何组织代码? 第1页

  

user avatar   haifeng-jin 网友的相关建议: 
      

代码结构

每个项目都会有基类和子类,我一般会把基类和基本的框架代码放在一个Module里面,而所有继承同一个基类的子类放在一个Module里。

例如,Keras项目中Layer这个基类在engine目录下,而所有具体的层,Conv2D和Dense之类的放在layers目录下。

在给用户提供import路径时,可以适当与实际位置分离。方便用户记忆。例如,用户可以从keras.layers.Layer来import这个基类,而不用去engine里面找一个很深的路径。

所有库内部的import全都使用绝对路径,相对路径更容易写出bug,对重构也不够友好。

测试结构

通常我是在代码的文件夹之外再建一个测试文件夹。这个测试文件夹里面分为集成测试和单元测试两个子文件夹。单元测试里面的所有目录文件结构与实际production代码相同,只不过每个文件要加个test后缀,例如源文件是/package_name/engine/callback.py那么测试文件就叫/tests/unit_tests/engine/callback_test.py。

至于集成测试,可以放在/tests/integration_test下面。里面的文件结构就比较随意。

写的顺序是集成测试先行,单元测试量力而行。因为一个大项目在开发初期会不停重构,以求得最佳的代码结构。毕竟到后期重构成本太高,所以前期精益求精。每次重构可能都会损坏很多单元测试。所以可以不那么急着把所有单元测试都写好。先把集成测试写了,整体能跑起来再说。




  

相关话题

  非计算机系学Python有什么建议? 
  Python/Pandas如何处理百亿行,数十列的数据? 
  计算机视觉研一,只学过Python基础,目前代码能力很差,要不要换导师,不换的话如何毕业? 
  GitHub 上有哪些优秀的 Python 爬虫项目? 
  对于一个开源 Python 量化交易平台项目的建议有哪些? 
  爬虫究竟是合法还是违法的? 
  如何实现 C/C++ 与 Python 的通信? 
  非计算机系学Python有什么建议? 
  Python为什么需要用import导入模块?直接自动将所有模块都导入不是更好吗? 
  哪里能找到数字版的PDF资料书呢(非扫描版,类似word转的那样,可以复制鼠标选中的内容)? 

前一个讨论
为什么有那么多人劝退化工学生?
下一个讨论
怎样理解经济模型中的内生/外生变量?





© 2025-05-06 - tinynew.org. All Rights Reserved.
© 2025-05-06 - tinynew.org. 保留所有权利