的形式我们无法表达函数因为我们不知道它是如何工作的。但是我们有大量的对关于它们我们知道。在我们的示例中这是大组手写字母和数字的图像其中针对每个图像指示上面描绘了什么符号。并且基于这个集合我们需要以某种方式构造实函数某个函数的近似值使得几乎总是与重合。这里有许多不同的方法。最简单的种称为最近邻它的本质是这样的。
我们获取样本并将其表示为多维空间中的组点。接下来我们取与我 亚美尼亚电子邮件列表 们要分类的对象的特征集对应的点。我们找到与它最接近的训练样本的个点并查看其中最常见的类别回想下对于训练样本中的每个对象我们最初知道正确的类别。我们将这个数量最多的类别归因于我们的对象。不幸的是并不适用于所有问题。比方说字母的手写版本可能有不同的风格大小将图像转换为单色后钢笔铅笔可能变成灰黑色等。在这种情况下很容易发现特征向量之间距离中的噪声比有意义的信息显得更亮模型将无法正常工作。
在这种情况下需要更高级的模型。更高级的模型通常是根据以下原则构建的。让我们有个通用函数。这里的和和前面样是特征空间和类别集合Θ是所谓模型参数的空间。模型特定实例的这些参数也可以被认为是数字向量通常是非常多维的它可以有数千万个元素。通过改变模型的参数可以将函数拟合成我们感兴趣的函数可以这样想象。