cover

环境说明#

  1. 本内容默认你已经具备基础 Python 编程能力并熟悉 NumPy,Pandas 等常用库。当然,对于基础更弱的读者,我也提供了《附录一:机器学习数学基础》《附录二:机器学习常用工具》的内容供你参考。

  2. 所有的内容均使用 Jupyter Notebook 书写并运行,便于理解和复现。你可以先阅读附录章节《Jupyter Notebook 简明指南》了解 Jupyter Notebook 的基本使用方法。

  3. 深度学习的章节,对数据量和网络结构进行了简化,绝大部分都可以无需 GPU 运行,便于更多人学习。需要 GPU 的内容会在相应的章节中有说明。

  4. 除单独说明的章节外,所有代码均在 Python 3.10 环境下运行通过。一般情况下,代码可以在相关 package 的主流版本下运行,如果运行报错,可以尝试单独安装以下版本,部分库的安装也会在相应的章节中有提示。由于依赖较多且个别库的依赖之间存在版本冲突,所以不提供统一的 requirements.txt 文件。

    numpy == 1.26.1
    scipy == 1.11.3
    pandas == 2.1.2
    seaborn == 0.13.0
    matplotlib == 3.8.1
    scikit-learn == 1.3.2
    statsmodels == 0.11.0
    jieba == 0.42.1
    gensim == 4.3.2
    hdbscan == 0.8.33
    graphviz == 0.20.1
    mlxtend == 0.23.0
    tensorflow == 2.14.0
    nltk == 3.8.1
    flair == 0.13.0
    onnx == 1.15.0
    

WildCard


○ 推荐安装 GetVM 浏览器扩展,使用其提供的基于 Linux 操作系统的 Jupyter Notebook 在线环境进行代码实践。

○ 欢迎分享本文链接到你的社交账号、博客、论坛等。更多的外链会增加搜索引擎对本站收录的权重,从而让更多人看到这些内容。