题目:对比分析线性与非线性分类/回归的几何意义,理解不同模型的决策边界特征。
图:线性与非线性分类/回归的几何意义对比
简洁明了
绿色线条代表分类边界,红色和蓝色区域分别对应两个类别的决策区域
适用于线性可分的数据
类别预测:
绿色直线表示回归线
红色虚线表示残差(预测误差)
找到最佳拟合直线 \(y = ax + b\)
目标:最小化均方误差(最小二乘法)
绿色圆圈代表分类边界
能够分离环形分布的数据
内圆为一个类别,外圆为另一个类别
圆形决策边界:
类别预测:
绿色曲线表示非线性回归曲线
能够拟合具有弯曲趋势的数据
二次函数 \(y = ax^2 + bx + c\)
二次多项式回归:
目标:最小化均方误差
| 特征 | 线性模型 | 非线性模型 |
|---|---|---|
| 决策边界/拟合曲线 | 直线或超平面 | 曲线或曲面 |
| 数学形式 | 线性方程 | 多项式、指数、对数等 |
| 模型复杂度 | 简单 | 复杂 |
| 计算效率 | 高 | 相对较低 |
| 可解释性 | 强 | 弱 |
| 过拟合风险 | 低 | 高 |
| 适用数据 | 线性可分/线性趋势 | 复杂分布/非线性趋势 |
| 典型算法 | 线性回归、逻辑回归、SVM(线性核) | 多项式回归、决策树、神经网络、SVM(非线性核) |