针对数据中心中主机故障数据的标记稀缺的问题,提出一种改进的Co-Forest方法,结合少量标记和大量未标记的IT运维数据,实现硬件的故障预警。方法使用评估函数对Co-Forest算法的每轮训练需要加入的未标记数据进行过滤,避免半监督学习的性能恶化问题。对比实验结果表明,相比只使用了标记数据的分类模型和传统Co-Forest,方法能显著提高分类器的准确度。