终于!搬运工作结束了!之前的随笔记录基本上都从hexo迁过来了!
吐槽一下:之前的数学公式有点不太对劲,要全部换掉格式了 虽然说只要在md的页面上加这个就行, REF
- 原来inline都是
$ ... $
的格式,现在是\\( ... \\)
的格式了
本周简单的总结一下 因为好像差不多一个月没有更新过了www #
主要总结一下论文画图相关的总结还有经验(仅供参考,不全对ooo
总结一下(糊)论文的方法 #
写在前面 当时的场景是5/1小长假里面速通论文 5/7日晚上就要交了,所以质量必然高不了的
同时,因为是网络领域的会议,写作方法肯定和主流的AI会议不太一样,所以仅供参考
:)
AI会的Paper be like: #
-
拉上一堆作者
**+
(无贬义) -
对话框 + 图形
-
炫酷的emoji + LLM各种图标 + 色彩轰炸(存疑)
-
超绝大表格 各种sota横向对比
-
消融实验:为什么我们的贼jb厉害,薄纱现有的框架
-
具体原理是基本木有的/数学公式写出来不是让人看懂的(?)
回到网络会议 #
要点1 #
Abstract准确精炼,5句话最多了
要点2 #
Intro前面快速切入主题,最后点出本文贡献
要点3 #
- 模块设计图要够大 够清晰;
- 考虑配色和图形对比(色相对比 or 直曲对比 or 形状对比)
要点4 #
论文的结构要清晰,尤其是对比实验的部分
实验图清晰易懂
Findings #
-
conclusion随便写因为不重要,约等于复述摘要
-
reference部分的格式
问题1: 怎么画论文图呢 #
工具使用 #
省流;最简单的方法就是有请Claude 3.7/ChatGPT帮你画图
人工方法:直接用drawio
画 / PPT
其实也不错
(但是记得都要导出为pdf格式 且dpi像素要至少300以上)
图片数量 #
背景部分1张 + (一般是会涉及到系统的实现)1张overview图 (关键) + 系统里面的各个小模块图(n个) + 实验图(m个) + 实验表格
-
实验图的部分和前面的模块图分开来解释,因为实验图基本上就是和测量的数据强相关的,只需要能够表达出 系统的关键指标的变化 和 对比其他实现的提升幅度 / 特殊情况下为什么会下降 就可以的。
-
matplotlib
全家桶 + 基本的折线 / 柱状图 / 散点图 / subplots -
复合图形在同一张图上面(常见的是折线+柱状 / 折线+散点这样的)
背景图 1张 #
关键性:⭐⭐⭐⭐
论文背景除要在Introduction里面提到的内容,考虑到其实很多reviewer可能根本不懂你在做神魔,要尽量简单易懂就会偷懒先看图,而不会在意你在文章写了什么。
因此背景图(background部分)就需要做一件事情:
- 一个足够简单和清晰,但是有代表性的case 例子:我们的研究的具体应用是怎样的 (可以有1句话的图解在图片边上)
Overview图 1张 #
关键性:⭐⭐⭐⭐⭐
内容需要完整的表达出系统的设计思路和实现的关键点(就是你 做了什么)
-
FRAMEWORK TITLE
超大的好吧 -
SUB BLOCKS
加粗 -
多用
箭头
状态转移 / 流程 非常清晰,能够看到处理顺序 / 数据的流向
粒度划分:
- 系统构成分块(模块化)(大):宏观认知,边界清晰,够抽象
- 各个模块的功能(中) :对于具体细节的概括,精炼
- 关键功能的实现细节 (小) 具体例子:你的算法 / 用了什么工程设计技巧 / 可以细一点,但是不要每个都细
这样我第一眼就能够明白 做了大概是什么东西,涉及了哪些模块,亮点会在系统什么模块的什么部分
👆 这个例子里,我能够看到的是阶段分割 (训练 + 推理) 然后训练里面 好像是参考 经过了什么编码 + 风格的色块 / 内容色块(大概是风格知识 / 内容知识) 经过的是UNET(虽然我不知道内部会发生什么)
然后参数上面能够看出编码器是冻结的(固定),但是红色的风格构成模块是可变的(对比色) 最后我得到了目标的什么东西
那么我就知道了 这篇文章的大概贡献都在Q-Former
这个模块里面
推理也是类似的,但是感觉是为了完整性才放上来的。 (上面的分析全是我自己瞎猜的,我根本不会AI orz)
小模块图 n张(取决于你想要展开哪些部分) #
关键性:⭐⭐⭐
focus on 细节 和 值得关注的tricks / 技巧 / 算法思想点
(可能是一个反面例子)
这是我随手画的一个反面例子,对于大部分没有接触过领域知识的人来说,可能就只能get到的信息量有:
-
输入被变成了一个vector
-
还有一部分的vector从什么地方抽取过来
-
经过了一个aggergate的操作
-
经过了一个Regressor
-
输出了一个结果 \(X \% \)
但是其实内部的一些技巧都没有展示出来:
- vector的具体含义是什么(内部构成是什么)
- additional的操作是什么 (怎么进行的向量合成呢?)
- expected node上的数据怎么被抽取的(实际上需要额外的metric系统,daemons)
- 为什么需要GBR而不是采用别的模型呢? GBR内部的设计是什么呢?
这些其实都是缺失的,所以就会给人一种看不懂的感觉;
反而是一些Prediction / Total这些组件其实可以省略
graph LR; A[向量是什么]-->A1[系统的什么指标]; A[向量是什么]-->A2[指标含义和原理]; A1[系统的什么指标]-->B[组合原理]; A2[指标含义和原理]-->B[组合原理]; B[组合原理]-->B1[组合方式]; B[组合原理]-->B2[组合有效性]; B1[组合方式]-->C[GBR的执行流程]; B2[组合有效性]-->C[GBR的执行流程]; C[GBR的执行流程]-->D[跳转到系统下游];
实验图 n张 #
关键性:⭐⭐
我相信只需要实验的结果足够多,这个图完全没有难度吧(纯数据驱动xs)
核心:你的方案是在太强了!!! 薄纱所有其他人(就是这种感觉)就ok 🌶