粒球分类 – 模糊决策与智能计算实验室

粒球分类

粒球分类将粒球结构引入经典的分类算法。与聚类不同，分类是有监督任务——粒球的纯度约束确保每个粒球内的样本基本属于同一类别，因此粒球可以直接作为"带标签的单元"参与分类。

粒球 SVM

粒球 SVM 用粒球替代传统 SVM 中的支持向量。传统 SVM 在所有训练样本上求解二次规划问题，当数据量大时计算成本很高。粒球 SVM 的思路是：先生成粒球，然后只在粒球的边界（而非所有数据点的边界）上寻找分类超平面。

粒球 SVM 不仅加速了训练过程，还天然具备抗噪能力——噪声点不会单独成为支持向量干扰分类面，而是被其所在粒球的整体结构所"稀释"。

粒球 KNN 用粒球代替单个数据点进行近邻搜索。对于新样本，先找到最近的粒球（而非遍历所有训练样本），再根据这些粒球的标签和加权投票决定分类结果。

计算量从 $O(n)$ 降低到 $O(m)$ ，在大规模数据集上优势尤为明显。同时，粒球 KNN 对噪声点的鲁棒性也优于传统 KNN。

粒球决策树以粒球为基本划分单元构建决策树。传统决策树在每个节点上遍历所有特征和所有样本来寻找最优划分，粒球决策树则在粒球层面操作。

粒球粗糙集分类器将粒球思想与粗糙集理论结合。粗糙集通过上近似和下近似描述概念的不确定性边界，粒球提供了一种自然的"粗粒度"计算基础。两者的结合在不完整数据和含噪数据上有独特优势。