目前已经学到4-7 第7节(已经学完)
播放器用的是:https://www.videolan.org/
一、英文
analogy n. 类比; 比拟; 比喻; 类推
quadratic function 简介:二次函数(quadratic function)的基本表示形式为y=ax²+bx+c(a≠0)
superscript 上标
hash sign 井号
concretely 具体地; 具体; 具体的; 有形地
magenta adj. 紫红色的; 洋红色的
contour plot 等高线图
gradient n. (尤指公路或铁路的) 坡度,斜率,倾斜度; (温度、压力等的) 变化率,梯度变化曲线;
succinctness 简洁; 精炼; 简洁性; 简明
derivative term 查查度是层数项,字幕是:微分项
commutative adj. 交换的(排列次序不影响结果)
caveat n. 警告; 告诫;
pseudo-inverse function 伪逆函数 pinv
clunky adj. 笨重的
is just slightly clunkier than the Octave syntax
logarithm 对数
asymptote at zero : n. 渐近线
apostrophe symbol 单引号,即' n. 撇号; 省字符
tilde equals symbol ~=
bang equals |=
ampersand sign &
二、cost function
1.什么是cost function
我们的目标是:找到使这个成本cost function最小的θ0,θ1
2.假设θ0=0
3.θ0,θ1
用3D表示是这样的
不过我们用contour plot来表示。比如下图中左边的函数在右边图中显示就是那个红叉的点。
三、梯度下降算法
:= 表示赋值 assignment(其实就是python中的 x = 3)
α 是learning rate,对应的就是下山例子中的步长。
注意:θ0,θ1要同时执行的。
α后面的部分就是直线的斜率
四
Batch Gradient Descent:
"Batch": Each step of gradient descent uses all the training examples.
五、线性代数
Matrix可以用来表示房子的特征,比如:面积,楼龄等,Vector表示价格。
(一)含义不同
1、向量组是由若干同维数的列向量(或同维数的行向量)组成的集合。(其中的元素用y1,y2表示)
2、矩阵是一个按照长方阵列排列的复数或实数集合,由向量组构成。
乘法
用处:
单位矩阵
逆矩阵
4-2
多元线性回归
4-3 特征缩放
这个问题有多个特征,如果你能确保这些特征都处在一个相近的范围,意思是不同的特征取值在相近的范围内,这样梯度下降法就能更快地收敛。
均值归一化
4-4
如何判断梯度下降算法是否已经收敛?
比如到300,400的时候,效果已经不明显了。就是已经收敛了。
如何选择learning rate
4-6 这节没看懂
标准方程
如果n是上千的,还是使用标准方程,如果上万,考虑使用梯度下降法。
参考:
https://www.bilibili.com/video/av9912938/