翼度科技»论坛 编程开发 python 查看内容

Python 模块的加载顺序

7

主题

7

帖子

21

积分

新手上路

Rank: 1

积分
21
1.基本概念


  • module:模块, 一个 py 文件或以其他文件形式存在的可被导入的就是一个模块
  • package:包,包含有 init 文件的文件夹
  • relative path:相对路径,相对于某个目录的路径
  • absolute path:绝对路径,全路径
2.Python 解释器是如何查找包和模块的

Python 执行一个 py 文件,无论执行的方式是用绝对路径还是相对路径,interpreter 都会把文件所在的 directory 加入 sys.path 这个 list 中,并且是索引为 0 的位置。Python 就是在 sys.path 中查找包和模块的。
  1. import sys
  2. print(sys.path)
  3. print('Now in main.py')
  4. def hello():
  5.     print('michael hello')
  6. if __name__ == '__main__':
  7.     hello()
  8. # 执行 python test.py
  9. $ python test.py
  10. ['/tmp/module-package/app', '/usr/lib64/python27.zip', '/usr/lib64/python2.7', '/usr/lib64/python2.7/plat-linux2', '/usr/lib64/python2.7/lib-tk', '/usr/lib64/python2.7/lib-old', '/usr/lib64/python2.7/lib-dynload', '/usr/lib64/python2.7/site-packages', '/usr/lib/python2.7/site-packages']
  11. Now in test.py
  12. michael hello
复制代码
3.Python 解释器查找包的顺序

解释器查找包:

  • 解释器会默认加载一些 modules,除了sys.builtin_module_names 列出的内置模块之外,还会加载其他一些标准库,都存放在sys.modules字典中。
  • 然后就是搜索 sys.path 路径下的模块了。
  1. In [3]: import sys
  2. In [4]: print(sys.builtin_module_names)
  3. ('_abc', '_ast', '_codecs', '_collections', '_functools', '_imp', '_io', '_locale', '_operator', '_signal', '_sre', '_stat', '_string', '_symtable', '_thread', '_tracemalloc', '_warnings', '_weakref', 'atexit', 'builtins', 'errno', 'faulthandler', 'gc', 'itertools', 'marshal', 'posix', 'pwd', 'sys', 'time', 'xxsubtype', 'zipimport')
复制代码
这样的查找顺序将会导致同名包或模块被遮蔽。
示例2:
  1. # tree
  2. $ tree . -L 1
  3. .
  4. ├── __init__.py
  5. ├── name
  6. ├── os.py
  7. ├── test2.py
  8. ├── test.py
  9. └── test.pyc
  10. # test2.py
  11. import os
  12. from redis import Redis
  13. from test import hello
  14. print('Now in test2.py')
  15. print(os.getcwd())
  16. # 执行 python test2.py
  17. $ python test2.py
  18. Traceback (most recent call last):
  19.   File "test2.py", line 2, in <module>
  20.     from redis import Redis
  21. ImportError: No module named redis
复制代码
这里的 os 模块并不是是 built-in module,上面已经将 sys.builtin_module_names 内容打印出来了。只是 Python 解释器启动时就加载到了 sys.modules中缓存起来了。所以,即使在同目录下有同名模块,解释器依然是可以找到正确的 os 模块的!如果你在import os之前,先执行del sys.modules['os'],那么,标准模块 os 就会被同目录下的 os.py 屏蔽了。
redis 属于第三方模块,默认安装位置是 Python 环境变量中的 site-packages,解释器启动之后,会将此目录加到 sys.path,由于当前目录会在 sys.path 的首位,当前目录的 redis 优先被找到了,site-packages 中的 redis 模块被屏蔽了。
综上所述,搜索的一个顺序是:sys.modules 缓存 -> sys.path[0] 即当前目录查找 -> sys.path[1:]路径查找。
同时发现,模块被加载的时候,其中非函数或类的语句,例如 print('hello')、name=michael等,是会在 import的时候,默认就执行了。
4.交互式执行环境的查找顺序

交互执行环境,解释器会自动把当前目录加入到sys.path,这一点和直接执行文件是一样的,但是这种方式下,sys.path[0] 是存储的当前目录的相对路径,而不是绝对路径。
  1. In [4]: import sys
  2. In [5]: sys.path[0]
  3. Out[5]: ''
复制代码
5.模块中的 file 变量

1.文件中的 file

当模块以文件的形式出现 file 指的是模块文件的路径名,以相对路径执行 file 是相对路径,以绝对路径执行 file 是绝对路径:
  1. print __file__
  2. # 执行 python test.py
  3. $ python test3.py
  4. test3.py
  5. $ python /tmp/module-package/app/test3.py
  6. /tmp/module-package/app/test3.py
复制代码
2.交互式 Shell 中的 file

前交互式 Shell 的执行并不是以文件的形式加载,所以不存在__file__这样的属性:
  1. In [8]: __file__
  2. ---------------------------------------------------------------------------
  3. NameError                                 Traceback (most recent call last)
  4. <ipython-input-8-358d5687b810> in <module>()
  5. ----> 1 __file__
  6. NameError: name '__file__' is not defined
复制代码
6.sys.argv[0] 变量

sys.argv[0] 是获得入口执行文件路径,__file__ 是真实被执行模块的文件路径。比如下面例子中,test2.py 就是入口执行文件,而 test.py 就是在 import 时真实被执行的模块
  1. # test.py
  2. print(__file__)
  3. print(sys.argv[0])
  4. # test2.py
  5. import test
  6. # 执行 python test2.py
  7. /tmp/module-package/app/test.py # __file__
  8. test2.py # sys.argv[0]
复制代码
7.sys.modules 的作用

载入的模块存放在何处? 答案是 sys.modules。 模块一经载入, Python 会把这个模块加入 sys.modules 中供下次载入使用,这样可以加速模块引入,起到缓存作用。sys.modules 是一个 dict 类型的值。
  1. #学习中遇到问题没人解答?小编创建了一个Python学习交流群:725638078
  2. In [14]: sys.modules['requests']
  3. ---------------------------------------------------------------------------
  4. KeyError                                  Traceback (most recent call last)
  5. <ipython-input-14-8aefaef0aed5> in <module>()
  6. ----> 1 sys.modules['requests']
  7. KeyError: 'requests'
  8. In [15]: import requests
  9. In [16]: sys.modules['requests']
  10. Out[16]: <module 'requests' from '/usr/lib/python2.7/site-packages/requests/__init__.pyc'>
复制代码
  1. # 没有预先引入 math,但是 sys.modules 中已经有这个键
  2. In [18]: sys.modules['math']
  3. Out[18]: <module 'math' from '/usr/lib64/python2.7/lib-dynload/math.so'>
复制代码
需要注意的是, sys.modules['math'] 尽管可以看到 math 键,但是,要使用它,还是需要显示 import math 之后才能使用的,因为那只是 Python 解释器后台缓存的,你不显示引入,本地空间还是不会去发现它。
8.总结

Python 通过查找 sys.path 来决定包的导入,Python解释器启动时加载的模块缓存 > 同级目录 > sys.path[1:]。Python 中的特有属性 __file__ 以及 sys.argv[0]、sys.argv[0]、sys.modules 可以帮助分析包的查找和导入过程。

来源:https://www.cnblogs.com/Pythonmiss/p/18271383
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具