AI术语问答
来源:qademo 生态用户上传,upload_a9736ed128ba4eaa。
三、术语问答(每词含一句话解释 + 一句话场景)
| 术语 | 一句话解释 | 一句话应用场景 |
|---|---|---|
| 监督学习 | 用带答案的样本训练模型学会从输入映射到输出。 | 垃圾邮件分类:给一批“是/否垃圾”的邮件,让模型学会自动识别。 |
| 无监督学习 | 只给数据不给答案,让模型自己发现结构或规律。 | 客户分群:根据购买行为自动把用户分成几类,用于差异化营销。 |
| 强化学习 | 智能体通过试错和奖励信号学习最优策略。 | 围棋AI(AlphaGo):走对了得高分,走错了扣分,最终学会赢棋。 |
| 过拟合 | 模型把训练数据中的噪音也背下来了,导致对新数据表现差。 | 诊断模型只记了某医院患者特征,换一家医院就不会看病了。 |
| 嵌入(Embedding) | 把文字、图像等变成一串数字向量,让计算机理解相似性。 | 推荐系统:把用户和商品都转成向量,推荐和用户向量最接近的商品。 |
| Transformer | 一种靠“注意力机制”捕捉长距离依赖的神经网络架构,是大模型的基础。 | ChatGPT、BERT等几乎所有现代大语言模型的底座。 |
| 幻觉(Hallucination) | 模型编造出看似合理但实际错误的信息。 | 问“谁是某部小众电影的导演”,AI可能编一个名字,且很自信。 |
| 提示词工程 | 设计最优的输入文本,引导模型输出想要的结果。 | 写“你是一个资深产品经理,请用四象限分析功能优先级”比直接问“怎么排优先级”效果好。 |
| RAG(检索增强生成) | 先查外部知识库,再把检索到的信息结合问题一起发给LLM,减少幻觉。 | 客服机器人:先搜索产品手册,再根据手册内容生成回答。 |
| 微调 | 在预训练大模型基础上,用少量特定数据进一步训练,让其适应特定任务。 | 通用模型微调成法律咨询专用模型。 |
二、100个AI常用术语表(补充90个)
原有10个(监督学习、无监督学习、强化学习、过拟合、嵌入、Transformer、幻觉、提示词工程、RAG、微调)。以下按字母/拼音序补充90个,每个一行,包含术语和一句话解释。可直接合并到“术语问答库”。
- AI对齐(Alignment):确保AI系统的目标与人类价值观一致。
- Attention(注意力):在Transformer中,让模型聚焦于输入序列中相关部分的技术。
- Autoencoder(自编码器):一种神经网络,学习将输入压缩再重建,用于降维或生成。
- Backpropagation(反向传播):训练神经网络时,从输出端向输入端逐层计算梯度并更新参数的方法。
- Bagging(自举汇聚法):并行训练多个模型然后平均,降低方差(如随机森林)。
- Batch(批次):一次训练时输入模型的一组样本数量。
- BERT(双向编码器表示):Google的预训练语言模型,擅长理解任务(如情感分类)。
- Bias(偏差):模型预测值与真实值之间的系统性误差;也指标注数据中的社会偏见。
- Boosting(提升法):串行训练多个弱模型,每个纠正前一个的错误(如XGBoost)。
- Capsule Network(胶囊网络):一种试图保留空间层次关系的神经网络,改善CNN对姿态变化的处理。
- Chain-of-Thought(思维链):提示模型写出中间推理步骤,提高复杂问题准确率。
- ChatGPT:OpenAI基于GPT的对话模型,通过RLHF优化。
- CLIP:OpenAI的多模态模型,能同时理解图像和文本。
- Clustering(聚类):无监督学习,将数据分组为簇,簇内相似、簇间不同。
- CNN(卷积神经网络):擅长处理网格状数据(如图像),通过卷积核提取局部特征。
- Collaborative Filtering(协同过滤):推荐算法,利用“用户-物品”交互矩阵,寻找相似用户或物品。
- Cost Function(成本函数):同“损失函数”,衡量模型预测与真实标签的差距。
- Cross-Entropy(交叉熵):常用分类损失函数,测量两个概率分布的差异。
- Data Augmentation(数据增强):通过对原数据做变换(旋转、裁剪、噪声)来增加训练样本多样性。
- Dataset(数据集):用于训练、验证或测试模型的数据集合。
- Decision Tree(决策树):树形结构模型,内部节点是特征测试,叶子节点是输出。
- Deep Learning(深度学习):使用深层神经网络的机器学习分支。
- Diffusion Model(扩散模型):从纯噪声开始,逐步去噪还原成图像,DALL·E 2、Stable Diffusion等使用。
- Dropout:训练时随机丢弃部分神经元,防止过拟合的正则化技术。
- Early Stopping(早停):当验证集性能不再提升时提前结束训练,防止过拟合。
- Embedding(嵌入):将离散变数(词、用户ID)映射到连续向量空间。
- Epoch(周期):整个训练数据集完整通过模型一次。
- Exploding Gradient(梯度爆炸):深层网络中梯度变得极大,导致数值不稳定。
- Feature Engineering(特征工程):从原始数据中提取或变换出更有预测力的特征。
- Feature Map(特征图):卷积层输出的激活值矩阵。
- Few-shot Learning(少样本学习):模型在仅看到少量例子后就能泛化到新任务。
- Fine-tuning(微调):在预训练模型基础上用少量特定数据继续训练以适应下游任务。
- GAN(生成对抗网络):一个生成器伪造数据,一个判别器鉴别真伪,两者对抗训练。
- Gated Recurrent Unit(门控循环单元):LSTM的简化变体,参数更少但效果接近。
- Gradient(梯度):损失函数对参数的偏导数,指示参数更新的方向。
- Gradient Descent(梯度下降):沿梯度反方向更新参数,使损失最小化。
- Graph Neural Network(图神经网络):处理图结构数据(社交网络、分子结构)的神经网络。
- Ground Truth(真实标签):训练集中正确的输出值。
- Hallucination(幻觉):模型生成看似合理但错误的信息。
- Hard Negative Mining(难负例挖掘):在训练中挑选模型最容易混淆的负例,提高区分能力。
- Hyperparameter(超参数):模型训练前需要人为设定的参数(如学习率、层数),不能从数据中学习。
- ImageNet:大型图像分类数据集,每年ILSVRC比赛,推动深度学习兴起。
- Inference(推理):模型训练完成后对新数据预测的过程。
- Jupyter Notebook:交互式计算环境,常用于数据分析与模型探索。
- K-Means:经典聚类算法,通过迭代更新簇中心,将样本分成K个簇。
- KNN(K近邻):一种非参数分类/回归算法,预测时找最近的K个训练样本。
- Knowledge Distillation(知识蒸馏):用一个大型教师模型教一个紧凑学生模型。
- L1/L2 Regularization(L1/L2正则化):在损失函数中添加权重的绝对值之和(L1)或平方和(L2),防止过拟合。
- Label(标签):监督学习中的输出值,即要预测的目标。
- LangChain:一个开源框架,用于构建基于大语言模型的应用程序,支持链、Agent等。
- Latent Space(潜在空间):模型学习到的低维表示空间,保留了数据的关键特征。
- Learning Rate(学习率):梯度下降中参数更新的步长大小。
- Linear Regression(线性回归):预测连续值的线性模型,形式为 y = wx + b。
- Logistic Regression(逻辑回归):用于二分类的线性模型,输出概率。
- Loss Function(损失函数):衡量模型预测与真实值的差距。
- LSTM(长短时记忆网络):一种RNN变体,通过门控机制解决长期依赖问题。
- Machine Learning(机器学习):让计算机从数据中学习规律而非显式编程。
- Masked Language Model(掩码语言模型):类似BERT,随机掩盖一些词然后预测,用于双向上下文理解。
- Mean Squared Error(均方误差):回归任务常用损失函数,计算预测与真实值差值的平方平均。
- Meta-Learning(元学习):学习如何学习,让模型快速适应新任务。
- Model(模型):从数据中学到的映射函数,通常由参数定义。
- Multi-modal(多模态):涉及多种数据形式(文本、图像、音频)的AI模型。
- Naive Bayes(朴素贝叶斯):基于贝叶斯定理且假设特征独立的分类器。
- Neural Network(神经网络):由多层神经元(节点)组成的计算图,每层通过非线性激活。
- Neuron(神经元):神经网络的基本单元,对输入加权求和后加偏置,再经激活函数。
- Normalization(归一化):将特征缩放到相似范围(如0~1或均值0方差1),加速训练收敛。
- One-hot Encoding(独热编码):将类别特征转为二进制向量,只有一个元素为1。
- Overfitting(过拟合):模型在训练集上表现太好,但在新数据上差。
- PCA(主成分分析):无监督线性降维方法,找最大化方差的方向。
- Perceptron(感知机):最简单的神经网络,用于二分类线性可分数值。
- Pooling(池化):下采样操作(最大/平均池化),减少特征图尺寸,增强平移不变性。
- Precision(精确率):TP/(TP+FP),预测为正的样本中实际为正的比例。
- Pre-trained Model(预训练模型):已在大规模数据上训练好的模型,可微调用于下游任务。
- Prompt(提示):输入给语言模型的指令或上下文,引导生成方向。
- QLoRA:一种高效微调方法,量化+低秩适应,降低显存需求。
- Quantization(量化):将模型参数从高精度(FP32)转为低精度(INT8),减少存储和加速。
- Recall(召回率):TP/(TP+FN),实际为正的样本中被正确预测的比例。
- Recurrent Neural Network(RNN):具有循环连接的网络,处理序列数据(如文本、时间序列)。
- Reinforcement Learning(强化学习):智能体通过与环境互动获得奖励信号,学习最优策略。
- ReLU(线性整流单元):激活函数 f(x)=max(0,x),简单且解决梯度消失问题。
- ResNet(残差网络):引入跳跃连接,允许训练极深网络(上百层)。
- Reward Hacking(奖励破解):智能体找到预期奖励定义的漏洞,而不是真正完成任务。
- RLHF(人类反馈强化学习):用人类偏好数据训练奖励模型,再通过强化学习优化语言模型。
- Sigmoid:S型激活函数,输出(0,1),常用于二分类输出层。
- Softmax:将输出向量转换成概率分布(和为1),用于多分类。
- Stable Diffusion:开源的文本到图像生成模型,基于潜在扩散模型。
- Supervised Learning(监督学习):使用带标签的数据训练模型进行预测。
- Support Vector Machine(SVM):寻找最大化类间间隔的超平面进行分类或回归。
- Temperature(温度系数):控制语言模型随机性的参数,值越高输出越多样,值越低越确定。
- Tensor:多维数组,深度学习框架(TensorFlow, PyTorch)中的基本数据结构。
- Test Set(测试集):最终评估模型性能的数据,训练过程中不可见。
- Token:语言模型处理的最小文本单元,可以是词、子词或字符。
- Training Set(训练集):用于模型参数学习的数据。
- Transfer Learning(迁移学习):将在一个任务上学到的知识应用到另一个相关任务。
- Underfitting(欠拟合):模型太简单,连训练数据的规律都没学会。
- Validation Set(验证集):用于调参和选择模型的数据,不参与训练但会参与比较。
- Vanishing Gradient(梯度消失):深层网络中梯度变得极小,导致浅层参数几乎不更新。
- Variational Autoencoder(变分自编码器):生成模型,学习潜在空间的概率分布。
- Weight(权重):神经网络中连接两个神经元的参数,控制信息传递强度。
- Zero-shot Learning(零样本学习):模型在没有见过任何样例的情况下,依靠语义描述识别新类别。
你可以将这些术语按字母或自定义分类(如基础、神经网络、训练技术、生成模型等)在知识库中做标签分组。