back to home

ZJU-LLMs / Foundations-of-LLMs

A book for Learning the Foundations of LLMs

15,923 stars
1,508 forks
56 issues

AI Architecture Analysis

This repository is indexed by RepoMind. By analyzing ZJU-LLMs/Foundations-of-LLMs in our AI interface, you can instantly generate complete architecture diagrams, visualize control flows, and perform automated security audits across the entire codebase.

Our Agentic Context Augmented Generation (Agentic CAG) engine loads full source files into context on-demand, avoiding the fragmentation of traditional RAG systems. Ask questions about the architecture, dependencies, or specific features to see it in action.

Source files are only loaded when you start an analysis to optimize performance.

Embed this Badge

Showcase RepoMind's analysis directly in your repository's README.

[![Analyzed by RepoMind](https://img.shields.io/badge/Analyzed%20by-RepoMind-4F46E5?style=for-the-badge)](https://repomind.in/repo/ZJU-LLMs/Foundations-of-LLMs)
Preview:Analyzed by RepoMind

Repository Overview (README excerpt)

Crawler view

✨ News: 我们开源了一款多智能体开发框架Agent-Kernel,让大家轻松玩转大规模多智能体系统!一百个智能体在自己的笔记本电脑上就能跑起来哦~ 科研、毕设、大创、SRTP都是让人眼前一亮的创新神器! Github 地址: https://github.com/ZJU-LLMs/Agent-Kernel 快来看看吧! 大模型基础 --> 本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议,持续进行**月度更新**,致力打造**易读、严谨、有深度**的大模型教材。并且,本书还将针对每章内容配备相关的**Paper List**,以跟踪相关技术的**最新进展**。 本书第一版包括**传统语言模型**、**大语言模型架构演化**、**Prompt工程**、**参数高效微调**、**模型编辑**、**检索增强生成**等六章内容。为增加本书的易读性,每章分别以**一种动物**为背景,对具体技术进行举例说明,故此本书以六种动物作为封面。当前版本所含内容均来源于作者团队对相关方向的探索与理解,如有谬误,恳请大家多提issue,多多赐教。后续,作者团队还将继续探索大模型推理加速、大模型智能体等方向。相关内容也将陆续补充到本书的后续版本中,期待封面上的动物越来越多。 当前完整的本书PDF版本路径为 大模型基础.pdf 。另外,我们还提供了两个文件夹, 大语言模型分章节内容 文件夹中包含了各章节的PDF版本。而 大语言模型相关论文 文件夹中包含了各章节的相关论文,当前正处于不断更新中。 其中每个章节的内容目录如下表所示。 本书目录 章节 所含内容 第 1 章:语言模型基础 1.1 基于统计方法的语言模型 1.2 基于 RNN 的语言模型 1.3 基于 Transformer 的语言模型 1.4 语言模型的采样方法 1.5 语言模型的评测 第 2 章:大语言模型 2.1 大数据 + 大模型 → 新智能 2.2 大语言模型架构概览 2.3 基于 Encoder-only 架构的大语言模型 2.4 基于 Encoder-Decoder 架构的大语言模型 2.5 基于 Decoder-only 架构的大语言模型 2.6 非 Transformer 架构 第 3 章:Prompt 工程 3.1 Prompt 工程简介 3.2 上下文学习 3.3 思维链 3.4 Prompt 技巧 3.5 相关应用 第 4 章:参数高效微调 4.1 参数高效微调简介 4.2 参数附加方法 4.3 参数选择方法 4.4 低秩适配方法 4.5 实践与应用 第 5 章:模型编辑 5.1 模型编辑简介 5.2 模型编辑经典方法 5.3 附加参数法:T-Patcher 5.4 定位编辑法:ROME 5.5 模型编辑应用 第 6 章:检索增强生成 6.1 检索增强生成简介 6.2 检索增强生成架构 6.3 知识检索 6.4 生成增强 6.5 实践与应用 致谢 本书的不断优化,将仰仗各位读者的帮助与支持。您的建议将成为我们持续向前的动力! 所有提出issue的人,我们都列举在此,以表达我们深深的谢意。 如果有此书相关的其他问题,请随时联系我们,可发送邮件至:xuwenyi@zju.edu.cn。