0%

Mini-batch 梯度下降 将 \(X = [x^{(1)}, x^{(2)}, x^{(3)}, ..., x^{(m)}]\) 矩阵所有 \(m\) 个样本划分为 \(t\) 个子训练集, 每个子训练集称为 \(x^{\{i\}}\), 每个子训练集内样本个数均相同(若每个子训练集有1000个样本, 则 \(x^{\{1\}} = [x^{(1)}, x^{(2)}, ..., x^{(1000)}]\), 维度 \((n_x,1000)\)). 若m不能被子训练集样本数整除, 则最后一个子训练集样本可以小于其他子训练集样本数. \(Y\) 亦然...

训练集、验证集、测试集(Train, Dev, Test Sets) 当数据量小的时候, 70% 训练, 30% 测试;或 60% 训练、20% 验证、20%测试. 当我们有大于100万条数据时, 测试集验证集各取1万条即可, 足以评估单个分类器. 确保验证集和测试集的数据来自同一分布. 如果不需要无偏估计, 可以不设置测试集. 当没设立测试集的时候, 验证集通常被人们称为测试集. 偏差、方差(Bias, Variance) 高偏差(high bias)称为"欠拟合"(underfitting), 练集误差与验证集误差都高. 高方差(high varia...

[TOC] 激活函数 Sigmoid 不怎么用了. \(a = g(z) = \sigma(z) = \frac{1}{1+e^{-z}} \\ g'(z) = a(1-a)\) Tanh 比Sigmoid好. 因为其值域为(-1, 1), 计算得a的平均值靠近0, 更好的centers the data(不知道怎么翻译比较好), 有利于下一层的计算. \(a = g(z) = tanh(z) = \frac{e^{z}-e^{-z}}{e^{z}+e^{-z}} \\ g'(z) = 1 - (tanh(z))^2\) ReLU(Rec...

完善了一下星空连线背景效果. 添加了粒子的鼠标跟随的效果. 参考的类似功能的JS源码都处理压缩过, 没有换行缩进, 变量名都是a, b, c... 看着真累啊. 把两次遍历改成了一次遍历, 把鼠标所在的点 p0 与 points 数组 concat 到一起处理了. 舍弃了原来按时间间隔计算移动距离的方法, 直接每一帧移动一定距离. 优化了代码, 提高了些性能. 鼠标跟随的原理是, 当粒子靠近鼠标指针到一定距离区间内, 就每帧向鼠标靠近对应距离. 所以当粒子一边远离一边被吸引时在边界会有些许鬼畜. 点此访问演示DEMO 截图: 演示图片 源码: 12345...

Deep Learning 用逻辑回归训练图片的典型步骤. 学习Coursera上吴恩达老师Deep Learning第一课程前两周的笔记. 1. 处理数据 1.1. 向量化(Vectorization) 将每张图片的高和宽和RGB展为向量, 最终X的shape为 (height*width*3, m) . 1.2. 特征归一化(Normalization) 对于一般数据,使用标准化(Standardization), z_i = (x_i - mean) / delta , mean 与 delta 代表X的均值和标准差. 最终特征处于[-1, 1]区...

Ubuntu一些装机用到的指令 修改分辨率 1sudo gedit /etc/default/grub 找到以下行: 1234# The resolution used on graphical terminal # note that you can use only modes which your graphic card supports via VBE # you can see them in real GRUB with the command 'vbeinfo' # GRUB_GFXMODE=640×480 下面添加一行: 1GRUB_G...

概念与表述 线性回归与逻辑回归的缺点:特征太多的时候计算负荷太大。 神经网络模型是许多逻辑单元按照不同层级组织起来的网络,每一层的输出变量都是下一层的输入变量。 直观理解 神经网络的单层神经元的计算可以用来表示逻辑运算,比如AND、OR。 如果用多层的话就可以组成功能复杂的神经网络。 多类分类 代价函数 逻辑回归的代价函数: 神经网络代价函数:(\(h_{\theta}(x)\)为K维度的向量,因为神经网络中可以输出很多变量。训练集中的因变量也是K维度) 反向传播算法 预测结果时我们正向传播:从第一层正向一层层传播,直到最后一层\(h_{\theta}(...

ACM忙完啦,最近想给自己的xienaoban.github.io做个博客网页,刚好没学过html之类的东西,就从零开始一边学一边做。之前一直对html5做的各种特效很感兴趣,就从网页背景开始写起吧。 曾经看到过别人的博客的背景有种特效,就是背景随机散布若干点不停移动,当两个点足够近的时候就会产生一条线连接两点,就像星座的连线一样;当点离鼠标很近的时候还会被吸引。于是自己也来实现个。 感觉js真的是个很神奇的语言,没有类,就把函数“假装”为类,并作为类似构造函数而存在,然后用prototype添加成员函数。看上去还真像那么回事,哈哈。 123456789...

Problem Description 众所周知,HDU的考研教室是没有空调的,于是就苦了不少不去图书馆的考研仔们。Lele也是其中一个。而某教室旁边又摆着两个未装上的空调,更是引起人们无限YY。 一个炎热的下午,Lele照例在教室睡觉的时候,竟然做起了空调教室的美梦。 Lele梦到学校某天终于大发慈悲给某个教室安上了一个空调。而且建造了了M条通气管道,让整个教学楼的全部教室都直接或间接和空调教室连通上,构成了教室群,于是,全部教室都能吹到空调了。 不仅仅这样,学校发现教室人数越来越多,单单一个空调已经不能满足大家的需求。于是,学校决定封闭掉一条通气管道...

两道有上下界有源汇最小流。 步骤之前写的笔记里有。但是原理。。。确实不太懂。 步骤: 1. 按照无源汇有上下界的最大流的做法找出可行流(但不要建立t->s); 2. 添加t->s,流量上界INF; 3. 再次运行最大流,找出ss->st可行流; 4. 若ss不满载,则无可行流。反之,最小流为t->s的流量,每条边的流量为逆向边的流量(加上下界b)。 SGU176 - Flow construction 12345678910111213141516171819202122232425262728293031323334353637...

Description uva的pdf格式题目复制有问题,直接贴原题链接了。 UVA11248 - Frequency Hopping Key 给一个N点E条边的网络流,问能否找出1->N的一条流量等于C的流。若不能,若修改一条弧的上界,可否找到?列出所有可修改的弧。 先求出最大流,若大于C,输出“possible”。 若小于C,枚举修改每一条弧再次运行最大流(记得记录每条修改过的弧,本次最大流运行过后再重新把每条弧的流量恢复。不能每次都从头开始计算最大流,会超时)。 可以如下优化,不需要求最大流,只需流量大于等于C时就可以停止。不过既然已经AC了...

从大佬的博客里学到了很多东西,以下是自己的小总结。 无源汇有上下界可行流 步骤 建立超级源点ss与汇点st; 像普通网络流一样建图,但其中边的上界为c-b(上界-下界); 计算所有点的Dif(流入下界之和 - 流出下界之和)。 如果Dif[u]大于0,建立ss到u的上界为Dif的附加边; 如果Dif[u]小于0,建立u到st的上界为-Dif的附加边; 计算从ss到st的最大流; 计算每条附加边的流量。若每条附加边u的流量均为Dif[u](即每条附加边都满载),则说明找到了可行流。 算竞训练指南上说还要建立一条st到ss的流量上界INF的边,翻了很多资料博...

Description UVA11082 - Matrix Decompressing Some RxC matrix of positive integers is encoded and represented by its R cumulative row sum and C column sum entries. Given, R, C and those R+C cumulative row sum and column sums, you want to decode the matrix (i.e., find all the indivi...

Description Recently, Dima met with Sasha in a philatelic store, and since then they are collecting coins together. Their favorite occupation is to sort collections of coins. Sasha likes having things in order, that is why he wants his coins to be arranged in a row in such a way ...

2017 ACM-ICPC Asia Regional Qingdao Online - 1010 - Brute Force Sorting(HDU6215) Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others)Total Submission(s): 1195 Accepted Submission(s): 309 Problem Description Beerus needs to sort an array of N integers. ...