跳至内容

粒球分类

粒球分类将粒球结构引入经典的分类算法。与聚类不同,分类是有监督任务——粒球的纯度约束确保每个粒球内的样本基本属于同一类别,因此粒球可以直接作为"带标签的单元"参与分类。

粒球 SVM

粒球 SVM 用粒球替代传统 SVM 中的支持向量。传统 SVM 在所有训练样本上求解二次规划问题,当数据量大时计算成本很高。粒球 SVM 的思路是:先生成粒球,然后只在粒球的边界(而非所有数据点的边界)上寻找分类超平面。

粒球 SVM 不仅加速了训练过程,还天然具备抗噪能力——噪声点不会单独成为支持向量干扰分类面,而是被其所在粒球的整体结构所"稀释"。

粒球 KNN

粒球 KNN 用粒球代替单个数据点进行近邻搜索。对于新样本,先找到最近的粒球(而非遍历所有训练样本),再根据这些粒球的标签和加权投票决定分类结果。

计算量从 O(n)O(n) 降低到 O(m)O(m),在大规模数据集上优势尤为明显。同时,粒球 KNN 对噪声点的鲁棒性也优于传统 KNN。

粒球决策树与粗糙集分类

粒球决策树以粒球为基本划分单元构建决策树。传统决策树在每个节点上遍历所有特征和所有样本来寻找最优划分,粒球决策树则在粒球层面操作。

粒球粗糙集分类器将粒球思想与粗糙集理论结合。粗糙集通过上近似和下近似描述概念的不确定性边界,粒球提供了一种自然的"粗粒度"计算基础。两者的结合在不完整数据和含噪数据上有独特优势。

算法核心特点优先级
粒球 SVM用粒球边界替代支持向量,加速训练⭐⭐⭐⭐
粒球 KNN用粒球近邻替代点近邻,加速预测⭐⭐⭐⭐
粒球决策树在粒球层面构建决策树⭐⭐⭐
粒球粗糙集分类器结合粒球与粗糙集理论⭐⭐