下面是我们常用的机器学习模型:
无监督学习模型:不经过人工干预,完全靠机器自动化根据之前从未标记的数据来学习模型。
半监督学习模型:指学习数据中具有已标记数据和未标记技术数据,我们既要通过已标记数据的监督信息,又要通过未标记数据的信息来训练模型。
监督学习模型:指使用预先标记好的数据来训练模型。
强化学习模型:强化学习又称为评价学习,是指使用的算法可以根据与环境进行交互来获得奖励信号并调整模型。
如何选择正确的机器学习类型?
在对机器学习类型的选择前,我们会根据实际的应用情况对机器学习类型的性能、准确性、可靠性等方面进行考虑。当我们根据数据的来源考虑分析算法的不同优点和缺点时,从而可以让我们选择更合适的机器学习算法,这样可以获得更好的输出结果。机器学习从业者可能会结合多种机器学习类型和这些类型中的各种算法来实现最佳结果。无监督技术适合用来分析数据集,以实现对数据集中数据结构和数据关系的基本了解。新机器学习模型的性能取决于供给数据的性质、具体问题以及解决问题所需的条件。
机器学习常见的算法
1.监督学习
监督学习模型使用已标记的数据,机器学习可以自行学习已标记数据的特性。监督学习模型的缺点是需要给数据完成标记,标记数据这件事需要花费大量人力、物力。在某些情况下,这些标记可以作为自动化过程的一部分自动生成。常见的监督学习算法有分类和回归算法。
分类算法决定数据中表示的实体、对象或事件数据的类别。常用的分类算法包括决策树、逻辑回归、随机森林和支持向量机(Support Vector Machine,SVM)。
回归算法识别数据集中表示的多个变量之间的关系。常见的回归算法包括线性回归、多元回归、决策树、最小绝对收缩和套索回归。
2.无监督学习
无监督学习模型根据无标识的数据自动识别数据内部的结构。通过无监督学习模型,我们可以快速把数据进行分类。聚类和降维是两种常见的无监督学习算法类型。
聚类算法根据各种标准将相似的数据分组在一起。我们可以将数据分成不同的组,最终通过组内分析来识别每个组内的特定的模式。
降维算法(Principal Component Analysis,PCA)指通过降维算法把高维数据映射到维数较低的数据空间中,有利于数据的后续处理,能够有效降低随机变量数量。
3.半监督学习
半监督学习模型是在无监督学习算法中添加小部分带标识的数据一起训练学习的过程。
4. 强化学习
强化学习模型通常用于在模型部署后根据与环境交互来不断改进学习模型。
另外,机器学习可应用于图像处理、风险预测、交通及物流管理、自然语言处理等应用场景。