前言

你是否因为大语言模型学习曲线陡峭,而迟迟不敢开始?又或者,你尝试过一些课程,却发现内容要么过于浅显,要么太过晦涩难懂,导致中途放弃?别担心,这篇文章将为你扫清障碍,无论你是零基础小白,还是希望更进一步的开发者,这份精心规划的学习指南都能帮你找到适合自己的学习路径。

今天分享的这份学习指南不仅涵盖了从入门到专家的完整学习路线,还为你整理了丰富的资源链接,带你高效开启 AI 世界的大门!


1. 开启你的AI学习之旅

在正式学习之前,推荐你先浏览这份开源的大语言模型学习教程:大语言模型学习指南(GitHub 链接:https://github.com/ninehills/blog/issues/97)。

这份教程系统地将学习内容划分为三个部分,非常适合不同阶段的学习者。以下是它的核心框架:

  1. 入门篇
  • 掌握基础知识,学会调用 OpenAI API,适合非专业人士快速上手。
  1. 应用篇
  • 重点学习如何搭建推理环境,使用 LangChain、Dify 等框架,以及 Prompt 工程的核心方法,提升实际动手能力。
  1. 深入篇
  • 深入了解语言模型的技术原理和训练微调方法,掌握如 RAG(检索增强生成)、Agent 技术等前沿进展。

这三部分学习内容层层递进,从基础到前沿都有覆盖,无论你是小白还是开发者,都能找到适合自己的学习方向。接下来,我们将在文章中逐一展开这三部分内容,帮助你更清晰地规划自己的学习路线。

标记为【必看】的是我认为只要你对这个主题感兴趣,必须要看的资料。


2. 入门篇:初识AI的殿堂

在开始学习之前,你需要先做好两个准备:

  1. 申请 OpenAI API 账号:可通过 OpenAI 官网(https://platform.openai.com/)申请,熟悉语言模型的基本操作。

  2. 确保国际互联网的访问条件:为了更方便地接触各种模型,建议注册 openrouter.ai,这是一站式访问多种开源和闭源模型的服务平台。

以下是入门阶段推荐的核心课程和资源:

2.1 ChatGPT Prompt Engineering for Developers

  • 推荐理由:这是一门面向开发者的 Prompt 工程课程,主题看似专业,但内容设计得简单易懂,非常适合入门。

  • 课程链接:https://learn.deeplearning.ai/courses/chatgpt-prompt-eng/lesson/1/introduction

  • 中英文双语字幕:https://github.com/GitHubDaily/ChatGPT-Prompt-Engineering-for-Developers-in-Chinese

2.2 OpenAI Quickstart 【必看】

  • 推荐理由:这是 OpenAI 官方的快速入门指南,详细讲解了 API 使用方法和模型操作流程,初学者不可错过。

  • 资料链接:https://platform.openai.com/docs/quickstart

  • API使用方法链接:https://platform.openai.com/docs/api-reference

2.3 State of GPT 【必看】

  • 推荐理由:由 GPT 联合创始人制作,完整总结了 GPT 的训练过程和应用场景。

  • 亮点:包含精彩的视频讲解和配套 PPT,让你直观了解 GPT 的核心原理。

  • 视频链接:https://www.youtube.com/watch?v=bZQun8Y4L2A

  • PPT链接:https://karpathy.ai/stateofgpt.pdf


3. 应用篇:动手实践的天地

学习语言模型,不仅是看书、听课,更需要实践! 在应用阶段,你将学会如何利用大语言模型解决实际问题,并通过工具和框架搭建属于自己的应用。

3.1 推荐课程:

1. Building Systems with the ChatGPT API

  • 推荐理由:这是构建 ChatGPT 应用的全套教程,提供完整中文字幕,助你快速搭建自己的语言模型项目。

  • 课程链接:https://learn.deeplearning.ai/chatgpt-building-system/lesson/1/introduction

  • B站链接(带中文字幕):https://www.bilibili.com/video/BV1Ku411x78m/

2. LangChain 系列课程

  • 推荐理由:LangChain 是目前最受欢迎的大语言模型应用框架,适合希望深入开发的读者。

  • 亮点:推荐学习 “LangChain for LLM Application Development” 等课程,提供中文支持,降低理解难度。

  • 资料链接:https://python.langchain.com/docs/introduction/

  • 课程链接:https://learn.deeplearning.ai/langchain/lesson/1/introduction

  • B站链接(带中文字幕):https://www.bilibili.com/video/BV1Ku411x78m/

3.2 实用工具与指南:

  1. dify:优秀的开源应用编排工具,能帮助你快速构建基于 AI 的应用。(https://dify.ai/)

  2. GPT Best Practices:OpenAI 官方最佳实践指南,深入了解如何优化语言模型的使用效果。(https://platform.openai.com/docs/guides/gpt-best-practices/gpt-best-practices)

  3. OpenAI Cookbook:官方实践手册,包含丰富的代码示例,助你高效上手。(https://github.com/openai/openai-cookbook)

  4. Brex’s Prompt Engineering Guide:实用的 Prompt 工程指南,帮助你优化与模型的交互效果。(https://github.com/brexhq/prompt-engineering)


4. 深入篇:探索AI技术深度

在掌握基础和应用之后,你可以选择一个或多个方向深入研究。以下是六大专业方向的学习资源推荐:

1. 技术基础方向

  1. 《动手学深度学习》 【必看】
  • 推荐理由:结合李沐的 B 站视频,这是最好的深度学习入门课程。

  • 课程链接:https://zh.d2l.ai/

  • B站视频链接:https://courses.d2l.ai/zh-v2/

  1. 李宏毅深度学习课程
  • 推荐理由:生动有趣的讲解风格,适合加深理解。

  • 课程链接:https://www.bilibili.com/video/BV1J94y1f7u5/

  1. 3brown1blue 系列视频 【必看】
  • 推荐理由:以优质动画讲解复杂数学概念,特别适合理解模型底层原理。

  • 视频链接:https://www.youtube.com/watch?v=wjZofJX0v4M

2. 技术原理方向

技术原理方向关注大语言模型的理论基础和发展脉络,是深入理解模型能力和设计逻辑的核心学习领域。以下是推荐的必看资源:

  1. 大语言模型综述【必看】

迄今为止最好的学术向中文综述,系统梳理了大语言模型的发展、应用和挑战。

推荐阅读:(https://github.com/RUCAIBox/LLMSurvey)

  1. 大语言模型【必看】

迄今为止最好的大语言模型相关书籍,理论和实践并重,非常适合中文读者。

资料链接:https://github.com/LLMBook-zh/LLMBook-zh.github.io

  1. 《大规模语言模型:从理论到实践》

一本优秀的中文书籍,对理论与实践结合有较好的阐释。

资料链接:https://intro-llm.github.io/

  1. 清华大模型公开课第二季【必看】

系统了解大模型的历史、原理和前沿进展,非常适合对技术历史感兴趣的学习者。

B站链接:https://www.bilibili.com/video/BV1pf421z757

  1. GPT 系列论文精读

深入学习 GPT、GPT-2 和 GPT-3 的设计和演化过程,理解语言模型的架构与改进。

视频链接:https://www.bilibili.com/video/BV1AF411b7xQ

  1. Llama3.1 论文精读

最好的开源大模型论文精读资源,通过学习其改进策略和设计方法深入了解开源大模型的前沿技术。

B站视频链接:https://www.bilibili.com/video/BV1WM4m1y7Uh

  1. 复杂推理:大语言模型的北极星能力

一篇略偏学术的文章,从推理能力的角度解析大语言模型的能力来源。

资料链接:https://yaofu.notion.site/6dafe3f8d11445ca9dcf8a2ca1c5b199

  1. ICML 2024 Tutorial: Physics of Language Models by Zeyuan Allen-Zhu【必看】

这是一份非常有参考价值的教程,通过黑盒研究方式探索语言模型的物理学原理。

B站视频链接:https://www.bilibili.com/video/BV1TPpbeVEUi/

3. 训练微调方向

训练微调方向聚焦于从零构建模型及对现有模型的优化。以下是推荐的必看资源:

  1. Build a Large Language Model (From Scratch)【必看】

从零开始构建一个完整的大语言模型,包括预训练、微调和部署全流程。

教科书github链接:https://github.com/rasbt/LLMs-from-scratch

  1. LLaMA-Factory【必看】

最推荐的微调工具之一,支持高效地调整模型参数,适用于开源模型的优化。

github链接:https://github.com/hiyouga/LLaMA-Factory

  1. MAP-NEO

唯一全过程开源的中文大模型项目,覆盖了数据处理工具、预训练数据和微调数据等全流程。

github链接:https://github.com/multimodal-art-projection/MAP-NEO

4. 数据工程方向

数据工程方向的核心是数据的预处理与微调,它直接影响语言模型的性能和适用性。以下是推荐资源:

  1. 微调数据合成指南:了解如何构建高质量训练数据。

教你如何合成高质量的微调数据,提升模型效果。

资料链接:https://eugeneyan.com/writing/synthetic/

  1. 中文行业预训练语料 IndustryCorpus 2.0

高质量的中文预训练语料库,其数据处理流非常科学,尤其适用于中文场景。

资料链接:https://data.baai.ac.cn/details/BAAI-IndustryCorpus-v2

数据处理工具:推荐使用 FlagData,这是一款优秀的预处理工具。(https://github.com/FlagOpen/FlagData/blob/main/README_zh.md)

5. 推理优化方向

推理优化方向解决的是大语言模型在实际应用中的性能瓶颈问题,重点关注推理速度、计算效率以及模型量化。以下为推荐学习资源:

  1. Transformer 部署挑战分析【必看】

深入分析长上下文 Transformer 的推理性能瓶颈及解决方法。

论文链接:https://arxiv.org/abs/2405.08944

  1. 量化技术的可视化指南

通过图文并茂的方式解析大模型的量化技术,让复杂的量化理论更容易理解。

文章链接:https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-quantization

6. 应用方向

应用方向聚焦于 Prompt 工程、RAG(检索增强生成)系统及 Agent 技术等前沿应用,是提升生产力和探索新技术的核心方向。以下是推荐资源:

  1. Prompt 工程方法综述

Prompt 工程综述,总结了在不同 NLP 任务中 Prompt 工程的最佳实践。

论文链接:https://arxiv.org/abs/2407.12994

  1. RAG 系统优化研究

提供了高级 RAG 系统的优化方法,将 RAG 系统模块化,像搭建 LEGO 一样灵活。

论文链接:https://arxiv.org/pdf/2407.21059

  1. Lillin Weng写的关于AI Agent的文章 经典 “LLM Powered Autonomous Agents”

介绍早期关于 Agent 技术的优秀文章,适合初学者快速入门。

https://lilianweng.github.io/posts/2023-06-23-agent/


5. 学习建议:四步助你高效进步

  1. 明确目标:根据自己的需求选择学习深度,初学者可以从入门篇开始,逐步深入。

  2. 循序渐进:按照入门、应用、深入的顺序推进,不必贪多求快。

  3. 重视实践:多动手操作,搭建实际项目,巩固所学知识。

  4. 持续更新:关注 AI 的前沿发展,保持学习的热情与好奇心。


总结

这份学习指南的价值在于:系统性、针对性和实用性。无论你是 AI 学习的初学者,还是有一定基础的开发者,都能在这里找到适合自己的学习资源。 记住,最重要的是迈出第一步,然后保持学习的热情与耐心!

AI大模型学习路线

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

扫描下方csdn官方合作二维码获取哦!

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

请添加图片描述
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐