首页>职场小聪明的书评 > 第961章 AI里的白盒黑盒和正则化

第961章 AI里的白盒黑盒和正则化

目录

白盒模型和黑盒模型,就是人工智能的两种算法,白盒顾名思义,可以用人的理解,就是决策树,叶子大于5放左边,叶子小于五放右边,然后继续往下一层,就是无限的分类,可以理解,而黑盒模型就不一样了,是机器学习,多层神经网络,每个层的一定数量神经元全连接,数据反复自己的调参,加权重,也就是什么数据重要,什么不重要,但都要,只是分量不一样,然后还会根据结果是否准确率高再删除一些数据,再进行反向调参,正向叫线性编程,反向就是回归,反正就是倒腾几百万次,数据变来变去,人无法理解,最后出来一个模型,就可以跟现有数据高度吻合

这是一个白盒模型,决策树,可以一层层的分类,容易理解。

正则化(Regularization):原理、方法与应用

在机器学习和深度学习中,过拟合(overfitting)是模型训练的核心挑战之一——模型在训练数据上表现极佳,但在未见过的测试数据上泛化能力差。

正则化正是解决这一问题的关键技术,其核心思想是通过在损失函数中引入“惩罚项”

,限制模型参数的复杂度,迫使模型学习更简单、更具泛化性的特征,而非死记硬背训练数据中的噪声。

一、正则化的核心目标与本质

1.核心目标

平衡“模型拟合能力”

与“泛化能力”

:避免模型因过度追求训练误差最小化,而忽略对新数据的适应性。

控制模型复杂度:复杂度过高的模型(如高次多项式、深层神经网络)易学习训练数据中的噪声,正则化通过约束参数规模降低复杂度。

2.本质理解

正则化的本质是**“奥卡姆剃刀原理”

在机器学习中的体现**——在多个能拟合数据的模型中,选择“最简单”

(参数更简洁、特征更通用)的模型,其泛化能力通常更强。

例如:用多项式拟合数据时,一次函数(y=ax+b)比五次函数(y=ax?+bx?+...+e)更简单,若两者在训练数据上误差接近,一次函数对新数据的预测更稳定。

二、经典正则化方法(针对传统机器学习)

传统机器学习(如线性回归、逻辑回归、支持向量机)中,正则化主要通过对模型参数的“范数惩罚”

实现,常见有L1、L2正则化,以及两者结合的ElasticNet。

1.L2正则化(岭回归,RidgeRegression)

原理

L2正则化通过在损失函数中加入参数的平方和惩罚项,限制参数的“整体规模”

(避免参数值过大)。

以线性回归为例:

原始损失函数(均方误差mSE加入L2正则后的损失函数:其中:(正则化强度):控制惩罚力度,时退化为原始模型,越大惩罚越强(参数越接近0):模型的权重参数(不含偏置项,因偏置项仅影响整体偏移,不直接导致过拟合):为了求导后抵消系数,简化计算(非必需,仅影响的数值尺度)。

核心特点

参数“收缩”

(Shrinkage)

:L2惩罚会让所有参数向0靠近,但不会将参数直接置为0(参数值整体变小,但保留所有特征)。

抗噪声能力强

:参数值减小后,模型对输入数据的微小波动(噪声)更不敏感,泛化性提升。

适用场景

:特征之间存在相关性、不希望删除任何特征的场景(如医学特征,每个指标都可能有意义)。

2.L1正则化(套索回归,LassoRegression)

原理

本章未完,点击下一页继续阅读



返回顶部