AI术语问答

来源：qademo 生态用户上传，upload_a9736ed128ba4eaa。

三、术语问答（每词含一句话解释 + 一句话场景）

术语	一句话解释	一句话应用场景
监督学习	用带答案的样本训练模型学会从输入映射到输出。	垃圾邮件分类：给一批“是/否垃圾”的邮件，让模型学会自动识别。
无监督学习	只给数据不给答案，让模型自己发现结构或规律。	客户分群：根据购买行为自动把用户分成几类，用于差异化营销。
强化学习	智能体通过试错和奖励信号学习最优策略。	围棋AI（AlphaGo）：走对了得高分，走错了扣分，最终学会赢棋。
过拟合	模型把训练数据中的噪音也背下来了，导致对新数据表现差。	诊断模型只记了某医院患者特征，换一家医院就不会看病了。
嵌入（Embedding）	把文字、图像等变成一串数字向量，让计算机理解相似性。	推荐系统：把用户和商品都转成向量，推荐和用户向量最接近的商品。
Transformer	一种靠“注意力机制”捕捉长距离依赖的神经网络架构，是大模型的基础。	ChatGPT、BERT等几乎所有现代大语言模型的底座。
幻觉（Hallucination）	模型编造出看似合理但实际错误的信息。	问“谁是某部小众电影的导演”，AI可能编一个名字，且很自信。
提示词工程	设计最优的输入文本，引导模型输出想要的结果。	写“你是一个资深产品经理，请用四象限分析功能优先级”比直接问“怎么排优先级”效果好。
RAG（检索增强生成）	先查外部知识库，再把检索到的信息结合问题一起发给LLM，减少幻觉。	客服机器人：先搜索产品手册，再根据手册内容生成回答。
微调	在预训练大模型基础上，用少量特定数据进一步训练，让其适应特定任务。	通用模型微调成法律咨询专用模型。

二、100个AI常用术语表（补充90个）

原有10个（监督学习、无监督学习、强化学习、过拟合、嵌入、Transformer、幻觉、提示词工程、RAG、微调）。以下按字母/拼音序补充90个，每个一行，包含术语和一句话解释。可直接合并到“术语问答库”。

AI对齐（Alignment）：确保AI系统的目标与人类价值观一致。
Attention（注意力）：在Transformer中，让模型聚焦于输入序列中相关部分的技术。
Autoencoder（自编码器）：一种神经网络，学习将输入压缩再重建，用于降维或生成。
Backpropagation（反向传播）：训练神经网络时，从输出端向输入端逐层计算梯度并更新参数的方法。
Bagging（自举汇聚法）：并行训练多个模型然后平均，降低方差（如随机森林）。
Batch（批次）：一次训练时输入模型的一组样本数量。
BERT（双向编码器表示）：Google的预训练语言模型，擅长理解任务（如情感分类）。
Bias（偏差）：模型预测值与真实值之间的系统性误差；也指标注数据中的社会偏见。
Boosting（提升法）：串行训练多个弱模型，每个纠正前一个的错误（如XGBoost）。
Capsule Network（胶囊网络）：一种试图保留空间层次关系的神经网络，改善CNN对姿态变化的处理。
Chain-of-Thought（思维链）：提示模型写出中间推理步骤，提高复杂问题准确率。
ChatGPT：OpenAI基于GPT的对话模型，通过RLHF优化。
CLIP：OpenAI的多模态模型，能同时理解图像和文本。
Clustering（聚类）：无监督学习，将数据分组为簇，簇内相似、簇间不同。
CNN（卷积神经网络）：擅长处理网格状数据（如图像），通过卷积核提取局部特征。
Collaborative Filtering（协同过滤）：推荐算法，利用“用户-物品”交互矩阵，寻找相似用户或物品。
Cost Function（成本函数）：同“损失函数”，衡量模型预测与真实标签的差距。
Cross-Entropy（交叉熵）：常用分类损失函数，测量两个概率分布的差异。
Data Augmentation（数据增强）：通过对原数据做变换（旋转、裁剪、噪声）来增加训练样本多样性。
Dataset（数据集）：用于训练、验证或测试模型的数据集合。
Decision Tree（决策树）：树形结构模型，内部节点是特征测试，叶子节点是输出。
Deep Learning（深度学习）：使用深层神经网络的机器学习分支。
Diffusion Model（扩散模型）：从纯噪声开始，逐步去噪还原成图像，DALL·E 2、Stable Diffusion等使用。
Dropout：训练时随机丢弃部分神经元，防止过拟合的正则化技术。
Early Stopping（早停）：当验证集性能不再提升时提前结束训练，防止过拟合。
Embedding（嵌入）：将离散变数（词、用户ID）映射到连续向量空间。
Epoch（周期）：整个训练数据集完整通过模型一次。
Exploding Gradient（梯度爆炸）：深层网络中梯度变得极大，导致数值不稳定。
Feature Engineering（特征工程）：从原始数据中提取或变换出更有预测力的特征。
Feature Map（特征图）：卷积层输出的激活值矩阵。
Few-shot Learning（少样本学习）：模型在仅看到少量例子后就能泛化到新任务。
Fine-tuning（微调）：在预训练模型基础上用少量特定数据继续训练以适应下游任务。
GAN（生成对抗网络）：一个生成器伪造数据，一个判别器鉴别真伪，两者对抗训练。
Gated Recurrent Unit（门控循环单元）：LSTM的简化变体，参数更少但效果接近。
Gradient（梯度）：损失函数对参数的偏导数，指示参数更新的方向。
Gradient Descent（梯度下降）：沿梯度反方向更新参数，使损失最小化。
Graph Neural Network（图神经网络）：处理图结构数据（社交网络、分子结构）的神经网络。
Ground Truth（真实标签）：训练集中正确的输出值。
Hallucination（幻觉）：模型生成看似合理但错误的信息。
Hard Negative Mining（难负例挖掘）：在训练中挑选模型最容易混淆的负例，提高区分能力。
Hyperparameter（超参数）：模型训练前需要人为设定的参数（如学习率、层数），不能从数据中学习。
ImageNet：大型图像分类数据集，每年ILSVRC比赛，推动深度学习兴起。
Inference（推理）：模型训练完成后对新数据预测的过程。
Jupyter Notebook：交互式计算环境，常用于数据分析与模型探索。
K-Means：经典聚类算法，通过迭代更新簇中心，将样本分成K个簇。
KNN（K近邻）：一种非参数分类/回归算法，预测时找最近的K个训练样本。
Knowledge Distillation（知识蒸馏）：用一个大型教师模型教一个紧凑学生模型。
L1/L2 Regularization（L1/L2正则化）：在损失函数中添加权重的绝对值之和（L1）或平方和（L2），防止过拟合。
Label（标签）：监督学习中的输出值，即要预测的目标。
LangChain：一个开源框架，用于构建基于大语言模型的应用程序，支持链、Agent等。
Latent Space（潜在空间）：模型学习到的低维表示空间，保留了数据的关键特征。
Learning Rate（学习率）：梯度下降中参数更新的步长大小。
Linear Regression（线性回归）：预测连续值的线性模型，形式为 y = wx + b。
Logistic Regression（逻辑回归）：用于二分类的线性模型，输出概率。
Loss Function（损失函数）：衡量模型预测与真实值的差距。
LSTM（长短时记忆网络）：一种RNN变体，通过门控机制解决长期依赖问题。
Machine Learning（机器学习）：让计算机从数据中学习规律而非显式编程。
Masked Language Model（掩码语言模型）：类似BERT，随机掩盖一些词然后预测，用于双向上下文理解。
Mean Squared Error（均方误差）：回归任务常用损失函数，计算预测与真实值差值的平方平均。
Meta-Learning（元学习）：学习如何学习，让模型快速适应新任务。
Model（模型）：从数据中学到的映射函数，通常由参数定义。
Multi-modal（多模态）：涉及多种数据形式（文本、图像、音频）的AI模型。
Naive Bayes（朴素贝叶斯）：基于贝叶斯定理且假设特征独立的分类器。
Neural Network（神经网络）：由多层神经元（节点）组成的计算图，每层通过非线性激活。
Neuron（神经元）：神经网络的基本单元，对输入加权求和后加偏置，再经激活函数。
Normalization（归一化）：将特征缩放到相似范围（如0~1或均值0方差1），加速训练收敛。
One-hot Encoding（独热编码）：将类别特征转为二进制向量，只有一个元素为1。
Overfitting（过拟合）：模型在训练集上表现太好，但在新数据上差。
PCA（主成分分析）：无监督线性降维方法，找最大化方差的方向。
Perceptron（感知机）：最简单的神经网络，用于二分类线性可分数值。
Pooling（池化）：下采样操作（最大/平均池化），减少特征图尺寸，增强平移不变性。
Precision（精确率）：TP/(TP+FP)，预测为正的样本中实际为正的比例。
Pre-trained Model（预训练模型）：已在大规模数据上训练好的模型，可微调用于下游任务。
Prompt（提示）：输入给语言模型的指令或上下文，引导生成方向。
QLoRA：一种高效微调方法，量化+低秩适应，降低显存需求。
Quantization（量化）：将模型参数从高精度（FP32）转为低精度（INT8），减少存储和加速。
Recall（召回率）：TP/(TP+FN)，实际为正的样本中被正确预测的比例。
Recurrent Neural Network（RNN）：具有循环连接的网络，处理序列数据（如文本、时间序列）。
Reinforcement Learning（强化学习）：智能体通过与环境互动获得奖励信号，学习最优策略。
ReLU（线性整流单元）：激活函数 f(x)=max(0,x)，简单且解决梯度消失问题。
ResNet（残差网络）：引入跳跃连接，允许训练极深网络（上百层）。
Reward Hacking（奖励破解）：智能体找到预期奖励定义的漏洞，而不是真正完成任务。
RLHF（人类反馈强化学习）：用人类偏好数据训练奖励模型，再通过强化学习优化语言模型。
Sigmoid：S型激活函数，输出(0,1)，常用于二分类输出层。
Softmax：将输出向量转换成概率分布（和为1），用于多分类。
Stable Diffusion：开源的文本到图像生成模型，基于潜在扩散模型。
Supervised Learning（监督学习）：使用带标签的数据训练模型进行预测。
Support Vector Machine（SVM）：寻找最大化类间间隔的超平面进行分类或回归。
Temperature（温度系数）：控制语言模型随机性的参数，值越高输出越多样，值越低越确定。
Tensor：多维数组，深度学习框架（TensorFlow, PyTorch）中的基本数据结构。
Test Set（测试集）：最终评估模型性能的数据，训练过程中不可见。
Token：语言模型处理的最小文本单元，可以是词、子词或字符。
Training Set（训练集）：用于模型参数学习的数据。
Transfer Learning（迁移学习）：将在一个任务上学到的知识应用到另一个相关任务。
Underfitting（欠拟合）：模型太简单，连训练数据的规律都没学会。
Validation Set（验证集）：用于调参和选择模型的数据，不参与训练但会参与比较。
Vanishing Gradient（梯度消失）：深层网络中梯度变得极小，导致浅层参数几乎不更新。
Variational Autoencoder（变分自编码器）：生成模型，学习潜在空间的概率分布。
Weight（权重）：神经网络中连接两个神经元的参数，控制信息传递强度。
Zero-shot Learning（零样本学习）：模型在没有见过任何样例的情况下，依靠语义描述识别新类别。

你可以将这些术语按字母或自定义分类（如基础、神经网络、训练技术、生成模型等）在知识库中做标签分组。