针对现有聚类算法计算复杂度普遍较高的问题,提出了一种基于定位的方法.该算法采用空间定位的方法将数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任一数据点;通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.在电信数据集上的实验结果表明,算法的时间复杂度降至O(N)级别. 术 基于定位的数据聚类新算法 张舒博1,牛琨2 (1.中国电信北京研究院决策研究部,北京100035; 2.北京邮电大学网络与交换国家重点实验室,北京100876) 摘要:针对现有聚类算法计算复杂度普遍较高的问题,提出了一种基于定位的方法。该算法采 用空间定位的方法将数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任一数据 点;通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程。在电信数据集上的实验结果表 明,算法的时间复杂度降至0(Ⅳ)级别。 关键词:数据挖掘聚类定位法空间立方体 随着人类社会信息化水平的不断提高,数据和信息 的任何一个向量X E Z,X=(xl,x2,…,X肼),每个属性依次 的增长速度越来越快。面对堆积如山的数据和信息,如 按照公式置=(置一心啦)/(M似i一心m)(式中,i∈{l,2,…, 何挖掘出有用的知识,便成为科学研究的焦点。聚类……