前馈神经网络 激活函数激活函数:最关键部分 激活函数:连续并可导的非线性函数 激活函数及其导函数要尽可能简单 激活函数的导函数要在一个合适的区间内 Sigmoid型函数:指一类S型曲线函数,为两端饱和函数,包括Logistic函数和Tanh函数 Logistic函数:Logistic 函数可以看成是一个“挤压”函数,把一个实数域的输入“挤压”到 (0, 1) Tanh函数:Tanh函数可以看作放大并平 Notes > 课程 > 大三(上) > 神经网络与深度学习 #神经网络
A6分析与简答 A6.1 (5分) 分析卷积神经网络中用1×1的卷积核的作用。一文读懂卷积神经网络中的1x1卷积核 - 知乎 改变通道数 当卷积核的个数大于或小于输入通道数时,可以改变输出的通道数 增加非线性 1x1卷积核可以在不改变特征维度的情况下添加非线性激活 A6.2 (5分) 计算函数$𝑦 = max(𝑥_1,⋯,𝑥_𝐷)$和函数$𝑦 = argmax(𝑥_1,⋯,𝑥 Notes > 课程 > 大三(上) > 神经网络与深度学习 #深度学习 #神经网络
卷积神经网络 全连接神经网络: 参数太多 训练困难 网络结构复杂 没有考虑到图像的空间结构信息 动机比起浅层神经网络,深度神经网络会更难训练,然而,如果训练好一个深度网络,它会比浅层网络强大的多因此,有必要开发一种能够训练的深度网络结构卷积神经网络可以简化网络结构,同时利用空间结构信息 卷积神经网络卷积运算卷积经常用在信号处理中,用于计算信号的延迟累积 局部感受野单个视觉细胞仅对部分区域的特定模式反应局部感 Notes > 课程 > 大三(上) > 神经网络与深度学习 #神经网络
图神经网络 图是一种描述样本间关系的通用语言 图神经网络图神经网络是一种基于图结构数据的深度学习方法,学习图结构数据中的节点特征、边特征、图级表示 图是图神经网络研究的基本对象;𝐺=(𝑉,𝐸) 是描述复杂事务的数据表示形式,由节点和边组成; 可描述不规则数据(非欧式数据),充分利用数据间关系信息 使用神经网络变换、聚合来自目标节点其邻居的信息,迭代生成节点嵌入表示 对于单个节点,求取邻居 Notes > 课程 > 大三(上) > 神经网络与深度学习 #神经网络
ChatEdit ChatEditChatEdit是一个数据集,用于评估在此背景下的图像编辑和对话能力。ChatEdit是根据CelebA-HQ数据集(30k张1024×1024面部图像数据集,它提供了 40 个面部属性的二进制注释)构建的,包含与图像上的用户编辑请求相对应的带注释的多轮对话,21个可编辑属性 TODO:数据集是什么类型?一张图像和几个标签?图像生成后怎么判断生成是否符合要求 交互式面部图像编辑 跟 Notes > 论文
扩散模型论文todo 检查句号后面空格 论文检查: 论文中公式全部检查 公式文字部分也对应检查 图表全部检查 图表文字部分也对应检查 参考文献检查 20和29参考文献重点检查 学历补充 word格式整理好 检查论文,12.4之前 对比学习生成 hardsample自动数据增强识别出假数据https://arxiv.org/pdf/2207.00148.pdfhttps://arxiv.org/pd Notes > 论文 #扩散模型
扩散模型调研 12.27调研AI发展中的表格类数据研究趋势 看扩散模型超详细的扩散模型(Diffusion Models)原理+代码 - 知乎看TabDDPM 看Improved DDPM看Generative models for tabular problems、ddpm diffusion model相关检索。 Accelerating Diffusion Models via Early Stop of Notes > 论文 #扩散模型
论文查阅、写作与投稿的综合指南 学习性阅读:获取知识批判性阅读:创造知识论文中的研究内容得到的检验少,需要更多批判正题反题合题:结合正题和反题 问题是完成任务时出现某种现象的内在原因批判性阅读帮助发现、提出问题 如何进行批判性阅读:批:比较(求诸于外) 判:剖析(求诸于内) 论文写作工具:Overleaf & Grammarly Notes > 论文
专业实习 实验文档 大模型实验 三选一 实验1:基于 Stable_diffusion 实现图像生成图像的功能。主要 内容为完成各项基础运算配置、实现在潜在空间的反向过程特征 采样、补全推理阶段的关键步骤以及一系列基 本适配工作,实现由图像/文字生成图像。 实验2:基于 Llama2实现聊天机器人应用并在 DLP平台上进行 部署。主要内容为完成模型加载和适配、对话模板的应用、文本 生成的基 Notes > 课程 > 专业实习
Blitz软件 Blitz是一个软件包,内含一个虚拟机,给操作者提供一个建立操作系统内核的功能 学生将在主机上编辑、编译和链接他们的操作系统内核项目。然后,他们将使用仿真器在虚拟机上执行这些项目。当学生的代码出现错误时,仿真器会显示各种错误信息,学生可以使用仿真器工具进行调试 架构CPU 采用 RISC 设计,大致仿照 Sun 的 Sparc 架构。 BLITZ 处理器包含 32 个通用整数寄存器,每个寄存器为 Notes > 课程 > 大三(上) > 操作系统 #操作系统