tea-1128

Posted on 2022-11-30 Edited on 2025-03-28

11.30 ARC 136B - Triple Shift

https://atcoder.jp/contests/arc136/tasks/arc136_b

给定两个数组A和B, 长度为都是$N \ge 3$

对于两数组中任意相邻的三个元素$a[i], a[i+1], a[i+2]$, 可以执行以下操作任意次:

交换$a[i], a[i+1], a[i+2]$, 得到 $a[i+2], a[i], a[i+1]$

问是否可能让A和B相同?

解法

$x,y,z = z,x,y = y,z,x$ 可以发现这样的一个规律(三个元素必然可以排序第一个)
$N$个元素序列必然可以排序前$N-2$个元素

于是第一点我们可以直接排序A,B数组, 看构成是否一样?

构成不一样直接No, 否则继续观察内部元素

如果存在重复的元素, 那么必然可以把重复元素放到一起(所以肯定可以实现排序)
如果没有, 就要看最终前N-2排完序后最终是否一致了(因为不能出现x,z,y)这种顺序
(这里可以借助逆序对的奇偶性来反映这一点)

12.1 ARC 116D - I Wanna Win The Game

https://atcoder.jp/contests/arc116/tasks/arc116_d

解法

n个非负整数
所有数的和为m
所有数的异或和为0 $A_1\oplus A_2 \oplus ⋯ \oplus A_N=0$
$1 \le n,m \ge 5000$

所以每个元素取值在5000以内

对于异或和=0问题, 等价于观察每个比特为1出现的次数是否是偶数

对于相加和等于m, 等价于一个背包问题

用这样一个数组f[5000][32][2] 表示状态

f[x][y][z] 表示取得数字和为x, 比特位y上的1出现次数为z的方案数

每一轮更新滚动数组, 因为5000 < 8192 所以只会用到前几个比特位(2^13) 所以只有0-13这14个比特位有效

时间就是O(14NM) = 14 * 25 * 1E6 =

空间就是O(NM)

定义 $f[i]$为 n个元素和为i的时候的答案

推论:

由于异或和 = 0 意味着 i必须是个偶数(奇数的最后一位必然是1)
考虑$n$个数的二进制最低位, 有$j$个1, 从n个数里面取的有效方案数就是$C(n, j), j = 0,2,4,…$
去掉最低位后其余位数元素和等于$i - j$, 再进行右移, 考虑$f[(i-j)/2]$

得到了一个递推关系式$f[i] = \sum_j f[(i-j)/2] \ctimes C(n,j), \ j=0,2,4,…$
初始状态 $f[0] = 1$

所求的就是$f[m]$

12.02 ARC 077B

https://atcoder.jp/contests/abc066/tasks/arc077_b

计算一下发现只需要关注两个唯一出现的重复位置带来的影响即可
靠左边一侧的重复元素位置记作$x$, 右边一侧的元素记作$y$

那么对于给定长度$k$, 会产生重复计数的序列数是多少?

数左边的时候, 会再在右边数到一次
左侧$x - 1$个, 右侧$n - y - 1$个, 从这些里面选$k-1$个得到的序列都是重复的
可以预处理这一段

组合数计算+逆元可以参考模板

LC322 将节点分成尽可能多的组

被图论暴打了(悲)
https://leetcode.cn/problems/divide-nodes-into-the-maximum-number-of-groups/

贴一个周赛的T4做法

由于是一个普通图, 我们可以拆分成多个连通分量
下面假设是一个连通图

考虑图的性质发现如果是一个树(无环连通图), 那么始终可以满足题目要求
否则, 如果这个图存在奇数环就一定不行;
偶数环的连通图是可以完成分层操作的.

然后所求的答案就是每个连通分量内可以达到的最大分层数量, 这个我们不知道图的形状所以只能通过枚举BFS的起点来求

如何判断一个图是否含有奇数环(二分图)

不能二分图的有环图就是有奇数环
偶数环可以对角染色完成二分

class Solution:
    def magnificentSets(self, n: int, edges: List[List[int]]) -> int:
        """
            |y - x| = 1
            对于同一个点y
            从某个节点x到达y
            每一跳的组只能差1
            所以不同路径的长度差距一定是偶数(路径长度都是奇数/偶数)
        """

        g = [[]  for _ in range(n)]
        for e in edges:
            a, b = e[0] - 1, e[1] - 1
            g[a].append(b)
            g[b].append(a)

        # 时间戳判定BFS顺序
        time = [0] * n
        clock = 0
        def bfs(start):
            dep = 0
            nonlocal clock
            clock += 1
            time[start] = clock
            q = [start]

            while q:
                tmp = q
                q = []
                for x in tmp:
                    for y in g[x]:
                        if time[y] != clock:
                            time[y] = clock
                            q.append(y)
                dep += 1
            return dep
        
        color = [0] * n
        def is_bipartite(x, c):
            color[x] = c
            nodes.append(x)
            for y in g[x]:
                if color[y] == c or (color[y] == 0 and not is_bipartite(y, -c)):
                    return False
            return True

        ans = 0
        for i, c in enumerate(color):
            if c != 0: continue
            nodes = []
            # 存在奇数环
            if not is_bipartite(i, 1): return -1
            ans += max(bfs(x) for x in nodes)
        return ans

缺氧游戏记录

Posted on 2022-11-24 Edited on 2025-03-28

倒置星开荒记录…

机器学习作业-欺诈识别

Posted on 2022-11-24 Edited on 2025-03-28

令人吐血的作业…

tea-1121

Posted on 2022-11-22 Edited on 2025-03-28

下午茶知识点: 二维前缀和, 贪心&构造, 双指针&找规律

tea-1114

Posted on 2022-11-13 Edited on 2025-03-28

简介：下午茶合集11.14-11.19，可能会咕咕咕
知识点: 最小生成树, 数论, 二维矩阵二分, 构造

mlp-nn

Posted on 2022-11-06 Edited on 2025-03-28

placeholder replace me!

SVM-SVR

Posted on 2022-11-06 Edited on 2025-03-28

SVM/SVR-机器学习实验报告

1. 任务描述

采用什么方法实现一个什么样的任务? 解决了什么问题?

基于MNIST数据集, 设计和实现了一套分类器系统, 包括线性SVM和非线性SVM.

Based on the MNIST dataset, design and implement classifiers including: linear & nonlinear SVM.

设计一套回归系统, 包括SVR(支持向量回归)的算法.

Design a regression system to predict housing prices. The data are available at: https://www.kaggle.com/vikrishnan/boston-house-prices (also available at Sklearn). The regression algorithms should contain SVR.

2. 数据集描述

采用何种数据集开展实验？

MNIST: https://www.kaggle.com/competitions/digit-recognizer
Boston Prices: https://www.kaggle.com/vikrishnan/boston-house-prices
第一个实验是基于了手写数字-MNIST数据集
第二个实验则是基于波士顿房价数据集

数据集有什么特点？

MNIST-手写数字数据集

每一张图片都是28 * 28大小的标准图片
数据集合的大小比较大, 有42000张手写数字的图片; 测试集合也有28000张
数据集合中每种数字的分布比较的均匀

数据集的各项统计量是多少？

数据集大小：42000张28*28的数字灰度图片；
数据集参数数量：每一张图片的大小都是28*28，数字范围0-9，总计42000个输入训练样本。
训练样本中数字的具体的分布如下：

Boston Standard Metropolitan Statistical Area (SMSA) in 1970.

数据标签的维度很多（包括了是否沿河？教育资源水平，税收，交通，房屋的新旧等等各种可能的影响因素）
数据量小（总量只有506行），而且可能数据的年代比较久远了
数据的特点：以下是数据集的热力图，可以看出有一些列之间的相关度很高，比如TAX和RAD这两个指标几乎就是完全相关的（所以后续也有消除这些相关重复的尝试）

数据集的各项统计量是多少？

数据集大小：506行数据
数据集参数数量：11个输入参数，1个输出参数（价格中位数）
CRIM（犯罪率），CHAS（是否沿河），AGE（房屋年龄）等等……
数据集各项的单位都不一致，有bool类型，有实数类型，有百分比，千等等不同的单位

3.方法介绍

3.1数据预处理(如有)

第一个Part的MNIST数据集

没有任何预处理, 会提前观察一下图片的情况

House Price数据集

没有对数据项的直接处理，因为数据集没有缺少的数据项，数据值的分布范围看起来都比较正常，合理；虽然单位不一致，但是经过后续的转化后，都可以化成标准分布的数据，从而不会产生很大的影响。

3.2算法描述

两个实验所用到的核心都是SVM算法, 这里一并介绍:

SVM-支持向量机

输入: 样本集合 $T = {(x_1, y_1), …, (x_n, y_n)}$, $x$为输入变量, $y$为输出值(eg. 属于的类别)
输出: 我们的SVM模型 $y = w^Tx + b$

$w^T = w^{\star}$, $b = b^{\star}$

满足条件 $maxmin(f(x_i)) = max(min|{w^{*}}^{T}x + b|)$

其中我们记录$\rho = |w^{T}x + b|$ 为样本点的绝对距离, 由于此时我们的系数$w^*$的模大小是1, 因此实际的距离$y_i *f(w^Tx+b)/|w|$也就是上式的值(由于我们是一个二分类问题, $y_i$取值为${1, -1}$)

映射函数: $y = f(x_i) = w^Tx + b$
目标: 最大化 样本点到决策平面的最小距离, 此时落在这个最小距离上的样本被称为支持向量
目标函数 $min_w{ \frac{1}{2} |w|^2},\ s.t.\ \forall_{i = 1}^n y_i(w^Tx_i + b) \geq 1$

要证明我们的分类器SVM能够收敛, 我们这里沿用感知机模型的结论(感知机不要求这个函数距离的最小, 只要求分类正确因此可以存在很多个)

收敛性, 最多经过$(b^2 + 1)(R^2 + 1) / \rho^2$ 次更新,就能找到答案($R = max_i ||x_i||$)
SVM的重要参数: $\rho$ 几何距离大小(当$|w| = 1$时也就是函数距离)

$\rho$(margin) 决定了:

两个类是如何区分的
算法收敛的速度

SVM定义了函数距离

$\rho_f(x, y) = y \times f(x)$

$min\rho_f = \rho_{min} = min(\rho_f(x_i, y_i))$

目标就是找到一个模型满足:

$f* := argmax_f\rho_{min} = argmax_f min\rho_f(x_i,y_i)$

实际上也就是
$y = w^Tx + b$, 寻找一组参数$w^* = (w,b)$, 使得$\rho = min(y_i (\frac{w\cdot x}{|w|} + \frac{b}{w}))$ 最大(间隔最大)

当我们的$\rho > 0$时, SVM是硬间隔支持向量机。

以上是基本的SVM模型, 而如何更好地求解SVM引入了对偶形式地SVM

原问题

$argmax_{w,b}\ \rho,\ s.t.\ \frac{y_i(w^Tx+b)}{|w|} \geq \rho$

等价于

标准形式下(最近距离$\rho = 1$)的目标函数 $min_w{ \frac{1}{2} |w|^2},\ s.t.\ \forall_{i = 1}^n y_i(w^Tx_i + b) \geq 1$

引入Lagrange乘数项

转为求解 $L(w,b,\alpha) = \frac{1}{2}|w|^2 - \sum_{i = 1}^n\alpha_i (y_i(w^Tx_i + b) - 1))$

求导数为0得到中间结果

$w = \sum_{i = 1}^n \alpha_i y_i x_i$

$\sum_{i =1}^n\alpha_i y_i = 0$

代入原式 $L(w,b,\alpha) = \frac{1}{2}|w|^2 - \sum_{i = 1}^n\alpha_i (y_i(w^Tx_i + b) - 1))$

得到化简结果(w化简自然引入内积, 这也是后面非线性/核方法的重要基础)

$L(\alpha) = \sum_{i = 1}^n\alpha_ - \frac{1}{2}\sum_{i=1}^n\sum_{j=1}^n y_iy_j \alpha_i \alpha_j (x_i \cdot x_j)$

使得$\alpha_i \geq 0,\ 1\leq i \leq n$成立;

以及 $\sum_{i = 1}^n \alpha_i y_i = 0$

求出$\alpha$ 得到了 $w^*$

观察$f(x) = w^Tx + b = \sum_{i = 1}^n \alpha_i y_i x_i^T x + b$

对于所有支持向量$x_j$满足$y_jf(x_j) = 1$

也就是说$f(x_j) = \sum\alpha_i y_i (x_i \cdot x_j) + b$

$b^* = \frac{1}{N_s}\sum_{j\in S}(y_j - \sum_{i\in S} \alpha_i y_i x_i \cdot x_j)$
(其实就是所有支持向量的均值)

于是我们的判别函数
$f(x) = sgn(\sum_{i = 1}^n\alpha_i^* y_i x_i^T x + b^* )$就求出来了;

Non-Linear SVM 非线性支持向量机

$L(\alpha) = \sum_{i = 1}^n\alpha_i - \frac{1}{2}\sum_{i=1}^n\sum_{j=1}^n y_iy_j \alpha_i \alpha_j (x_i \cdot x_j)$
这里将原先的线性SVM内积换成核函数$K(x_i, x_j)$

得到代入核函数的内积

$L(\alpha) = \sum_{i = 1}^n\alpha_i - \frac{1}{2}\sum_{i=1}^n\sum_{j=1}^n y_iy_j \alpha_i \alpha_j (K(x_i, x_j))$

使得$\alpha_i \geq 0,\ 1\leq i \leq n$成立;

以及 $\sum_{i = 1}^n \alpha_i y_i = 0$

最终我们的分类函数可以表示为:

$f(x) = \sum_{i = 1}^n\alpha_i^* y_i K(x_i, x) + b^*$

为了能够更快求解Kernel-product, 我们对于给定的函数$k: X^2 \to K$, 以及原空间的向量模式$(x_1,…,x_n)\in X$

Gram矩阵$K_{ij} = k(x_i,x_j)$(内积矩阵)

于是就可以更快求解上面的目标式。

常用的核函数

高斯核函数 $k(x,x’) = e^{-\frac{|x-x’|^2}{2\sigma^2}}$
多项式核函数 $k(x,x’) = (x^T x + c)^d$

4.实验结果分析

4.1评价指标

MNIST的数据集

评价指标自然是分类的准确率 $p$ (分类正确个数/总测试样本数)

Boston房价数据集

由于是一个回归问题, 合理的评价标准是偏离度/SSE

这里采用 MSE(Mean Squared-Error) 以及确信度(也叫R^2系数)

4.2定量评价结果

1. MNIST分类结果

使用SVM/非线性SVM对于手写数字进行分类。

辅助函数

show_pics 用于展示几张经过模型学习过的图片样式和实际的结果
submit_result 用于提交我们的SVM模型预测结果到kaggle-submission

基本的线性SVM

经过基本的SVM模型学习后，我们来预测几张图片观察以下模型的效果

可以看到正确率已经有了80%以上，但是还是有很明显的错误识别(比如右上角的’3’)被识别成了’2’;

非线性的SVM

2. Boston预测准确率

线性SVM的实验结果

具体的分类器代码实现

最终的预测结果与实际数据之间的MSE大小为$25.38$
确信度(R-squared) 系数为 $0.659$

多项式核函数SVM

具体的分类器代码实现

经过试验后，挑选的多项式核函数度数为$3$, 正则项系数$C=10$

最终的预测结果与实际数据之间的MSE大小为$16.47$
确信度(R-squared) 系数为 $0.78$

径向基函数SVM

具体的分类器代码实现如下所示

SVR的默认实现就是 rbf

RBF（Radial Basis Function，径向基函数）是一个函数空间中的基函数，而这些基函数都是径向函数。

径向函数: 满足对于围绕着某固定点 $c$ 的等距的 $x$，函数值相同
$$
\phi(x) = \phi(||x-C||)
$$

使用rbf回归的svr代码：

最终的预测结果与实际数据之间的MSE大小为$13.82$ 可以看到较线性的SVR提升很大
确信度(R-squared) 系数为 $0.82$

4.3可视化结果

MNIST分类结果

使用最简单的线性SVM提交测试结果

即使是最简单的SVM，也已经可以达到86%左右的正确率了

使用多项式核函数的SVM

代码实现:

kernel挑选为多项式核
测试的多项式次数为3
正则项系数$C$的大小为10

后来经过了一系列的挑选和尝试，最终设置了SVC的多项式核函数度数为2

度数的选择

发现选择度数 = 2好像更好;

代码:

结果:

最终选择多项式核函数的SVM

预测结果:

预测的准确率达到了$0.95$附近的水平，已经很高了；
这也说明原先的数字分类问题不是一个线性可分的分类问题。

Boston预测准确率

最终的实验结果和分布曲线拟合情况如下所示：

线性SVR的实验结果
使用rbf核函数的SVR
多项式核函数的SVR

5.总结

比较不同方法的优缺点等。

SVM总结:

SVM算法是用于分类问题非常实用的一种算法；

SVM的优势在于解决小样本、非线性和高维的回归和二分类问题；
由于支持向量的数量其实占整个数据集合的比例通常不会很大，因此SVM可以用于选取数据集中的代表元，还可以用于缩小问题规模；
核函数方法扩展的SVM还可以解决非线性的分布下的分类问题，使得SVM更为实用。

使用核函数的SVM(SVR)

常用的核函数有多项式核函数(poly-kernel), rbf 径向基函数, Gaussian核函数等等；
核函数的技巧使得原先只能处理线性问题的SVM可以在更高的维度中处理原输入空间的非线性问题。

ml_notes

Posted on 2022-11-05 Edited on 2025-03-28

placeholder replace me!

软件中心化的云原生网络函数-机遇和挑战

Posted on 2022-11-01 Edited on 2025-03-28

为什么虚拟网络最终性能提升依赖于软件?

vhost协议对性能的磨损, virtio如何优化? 保持伸缩性同时尽可能提升BW和Throughput?

网络拓扑结构对目前云原生技术的影响&改进方案…

下午茶 1017-1022

Posted on 2022-10-17 Edited on 2025-03-28

下午茶合集

10.17 767C

树上, 一次DFS求出子树的和/子树的点权和, 必须掌握的套路

无关: 可以在线跑任务的平台:

colab google 需要科学需要外币
autodl 国内的不知道收费怎么样

10.18 1420D

https://codeforces.com/problemset/problem/1420/D

输入 $n, k(1\lt k \lt n \lt 3e5)$ 和 $n$ 个闭区间，区间的范围在 $[1,1e9]$。
你需要从 $n$ 个区间中选择 $k$ 个区间，且这 $k$ 个区间的交集不为空。
输出方案数模 $998244353$ 的结果。

对这些区间排序，比如按照左端点排序
选定其中的第$i$个区间，那么在它之后的，能够交集不为空的区间的左端点小/等于区间$i$的右端点，在它之前的能够交集不为空的区间的左端点大于/等于区间$i$的左端点
假设给定区间$i$，左边坐标是$l$，右边是$r$，那么在$[l, r]$ 区间里面任选$k - 1$ + 选择区间$i$ 就是包含区间$i$的方案数。
去重复的问题?

看了一眼解答，是这样去重复的

考虑每个区间$i$的左端点，考虑交点为$i$区间左端点$L$的情况；
有交集的集合假设有$m$个，其中左端点等于$L$的有$x$个
那么交集包含左端点$L$的可选个数就是$c(k,m) - c(k,m - x)$个就是去掉所有集合都不在这些里面的哪些解
把所有的区间交集取值为某个左端点，全部加起来就是答案了

组合数里面有除法，此时由于数字太大没法直接算除法，需要用乘法逆元

逆元科普：https://zhuanlan.zhihu.com/p/100587745