Classification

模型

分类问题中，预测的变量 y 为离散值，以前学习的线性回归模型就不适用了。分类将用到的算法是逻辑回归( Logistic Regression )。

我们先讨论二元的分类算法，即把输入分成两类，也就是说 y 的值为 0 或 1.

逻辑回归假设函数：$h_\theta(x)=g(\theta^Tx)$ 该函数值的范围始终是 0 到 1 之间。

当 $h_\theta(x) >= 0.5$ 时，预测 y = 1

当 $h_\theta(x) < 0.5$ 时，预测 y = 1

可以理解为 $h_\theta(x)$ 是计算给定输入，输出为 y=1 的可能性。

其中 g 代表的是逻辑函数，课程中选的逻辑函数叫 Sigmoid function, 该函数的图形是 S 形。

$g(x) = \frac{1}{1+e^{-x}}$

决策边界

简单说，就是假设函数所确定的图形线。这个例子中我们有：

当 $h_\theta(x) = g(\theta^Tx) >= 0.5$ 时，预测 y = 1
当 $h_\theta(x) = g(\theta^Tx) < 0.5$ 时，预测 y = 1

根据 Sigmoid 函数性质，可以继续得出:

$\theta^Tx >= 0$ 时，预测 y = 1
$\theta^Tx < 0$ 时，预测 y = 0

在图中画出 $y = \theta^Tx$ 的图形，如图

红色的线就是决策边界，将样本分为两类。所谓决策边界就是能够把样本正确分类的一条边界，主要有线性决策边界(linear decision boundaries)和非线性决策边界(non-linear decision boundaries)。注意：决策边界是假设函数的属性，由参数决定，而不是由数据集的特征决定。

非线性的决策边界