急求一个模糊聚类的问题!!

来源:百度知道 编辑:UC知道 时间:2024/05/17 01:22:33
我在模糊聚类的时候,有定量属性也有定性属性,这时我想应该用等级划分的方法来统一这些属性指标,但是很多论文都写得不详细,请问哪位高人可不可以给我详细介绍下,我还看到些论文是用把这些属性都二元转换来聚类,答得好我还有大大的加分哈!!

模糊聚类的时候,要计算2个数据之间的相似度(或相异度)。
定量属性就用距离来算就行了。
定性属性又分2种,一种是没有序的关系的。比如颜色,性别等等。一种是有序的关系的。比如一等品,二等品等等。
定性属性没有序的关系时,相异度可以用相同属性的个数与定性属性的总数之间的比值来衡量。【还有很多其他方法。。】
定性属性有序的关系时,相异度可以把定性属性当成量化后的定量属性来衡量【直接计算距离】。

个人觉得没有必要用等级划分的方法来统一这些属性指标。【因为,你在等级划分的时候可能会丢失掉一些有用的信息。而丢掉的这些信息也许会对最后的结果有影响。也就是说,如果你的聚类结果和等级划分方法相关,那么,聚类结果的说服力就会下降。】

如果一定要这样,等级划分就相当于做量化处理。
如果均匀分组【等宽】,要决定组距,组数,野点的处理等等。
不均匀分组【等深,或其他准则】,要决定组深,组数等等。
总之,分组的时候,既要尽量保留原有数据之间的关联,又要尽量将数据区分开。
俺觉得,等级划分的困难和确定定性属性之间的相异度相比,并不低。

要等级划分,可以找量化,数据分组等方面的参考文献。
要确定定性属性之间的相异度,可以找相异度,特别是混合数据类型之间的相异度方面的文献。