粒球分类
粒球分类将粒球结构引入经典的分类算法。与聚类不同,分类是有监督任务——粒球的纯度约束确保每个粒球内的样本基本属于同一类别,因此粒球可以直接作为"带标签的单元"参与分类。
粒球 SVM
粒球 SVM 用粒球替代传统 SVM 中的支持向量。传统 SVM 在所有训练样本上求解二次规划问题,当数据量大时计算成本很高。粒球 SVM 的思路是:先生成粒球,然后只在粒球的边界(而非所有数据点的边界)上寻找分类超平面。
粒球 SVM 不仅加速了训练过程,还天然具备抗噪能力——噪声点不会单独成为支持向量干扰分类面,而是被其所在粒球的整体结构所"稀释"。
粒球 KNN
粒球 KNN 用粒球代替单个数据点进行近邻搜索。对于新样本,先找到最近的粒球(而非遍历所有训练样本),再根据这些粒球的标签和加权投票决定分类结果。
计算量从 降低到 ,在大规模数据集上优势尤为明显。同时,粒球 KNN 对噪声点的鲁棒性也优于传统 KNN。
粒球决策树与粗糙集分类
粒球决策树以粒球为基本划分单元构建决策树。传统决策树在每个节点上遍历所有特征和所有样本来寻找最优划分,粒球决策树则在粒球层面操作。
粒球粗糙集分类器将粒球思想与粗糙集理论结合。粗糙集通过上近似和下近似描述概念的不确定性边界,粒球提供了一种自然的"粗粒度"计算基础。两者的结合在不完整数据和含噪数据上有独特优势。
| 算法 | 核心特点 | 优先级 |
|---|---|---|
| 粒球 SVM | 用粒球边界替代支持向量,加速训练 | ⭐⭐⭐⭐ |
| 粒球 KNN | 用粒球近邻替代点近邻,加速预测 | ⭐⭐⭐⭐ |
| 粒球决策树 | 在粒球层面构建决策树 | ⭐⭐⭐ |
| 粒球粗糙集分类器 | 结合粒球与粗糙集理论 | ⭐⭐ |