复试准备
复试流程
- 笔试:两道代码题,一道简答题
(30min)
中间有10min休息时间,可以拿手机查笔试题
- 面试:
- 讲解ppt(3页,3min)
- 英文提问(ppt上的项目、本科经历、日常对话)
- 三选一专业题目
- 专业课知识提问(PPT、项目、笔试题、随机)
(15min)
笔试:每天做几道算法题(贪心、排序、动态规划)
专业课复习:编程语言类(c++、python),软件工程(定义、原型、开发模型),软件测试(方法、分类),面向对象(定义),人工智能类(pytorch,机器学习、深度学习)
英语听说能力:
项目准备:
数据处理->模型结构(原理,优势)->训练方式(损失函数,优化器,参数更新)->评测指标,效果
论文
数据处理:对数值型特征进行归一化处理,对类别型特征进行one-hot
模型结构:对连续性数据(数值)进行高斯扩散,对离散型数据(类别)进行多项式扩散,用MLP进行噪声的估计
损失函数:连续数据的均分误差MSE和类别数据的KL散度
通过实验发现,DDPM生成的数据在弱分类器(决策树、SVM、贝叶斯、逻辑回归的平均值)和强分类器Catboost上表现接近或超越真实数据,增大样本规模可以提升效果(70、100倍),同时具有更好的隐私保护能力(DCR,NNDR)
关键方法:DDPM、SMOTE、CTAB-GAN、弱分类器、Catboost
关键指标:相关性矩阵、F1、AUC、ACC、DCR、NNDR、shapley
特征相关性矩阵的计算:计算特征的皮尔逊相关系数,协方差/标准差
AUC:以假阳率为横轴,真阳率为纵轴,通过改变分类阈值形成的ROC曲线下的面积,取值0.5-1越大越好
SMOTE:选择一个少数类样本,然后选择其最邻近样本,进行线性插值,形成新的样本
DCR:最邻近/所有点距离
NNDR:最邻近/次临近
shapley值:用于衡量每个特征对预测结果的影响,shapley值和真实数据近似,说明生成数据的可解释性好。
调参过程:利用网格调参,对学习率、batch size、扩散的timestep、MLP的层数:1024、512、512、512四层mlp,模型的扩散步数为1000步
实验设计:我们分别设计了数据重构实验和扩大数据规模实验,其中数据重构实验我们分别替换真实数据的正、负样本,或对真实数据的数据不平衡进行填充样本,分别测试效果,可以取得与真实数据相似的效果。以及我们设计了10到100倍规模的扩大数据规模实验,在某些特定规模上可以增强分类器的效果。
基于扩散模型的手绘跨域图像匹配算法(毕业设计)
利用扩散模型提取图像特征,进行手绘图像的稀疏匹配,用于患者精神疾病的诊断
模型:stable diffusion(SD),该模型主要分为三个部分,分别为CLIP text encoder,VAE,U-net。其中CLIP是将文本转化为embedding,然后通过cross attention机制将其与图像的latent一起送入Unet。VAE负责将原始的图像进行encoding和decoding,实现从原始图像到latent的转化。Unet则负责学习每个时间步的误差,然后根据一个随机噪声的latent、文本的embedding、时间步t来预测该时间步的噪声,然后从latent上减去这个噪声。
在本项目中,我们将将时间步长t的噪声添加到真实图像,然后将其与t一起送入U-net,提取U-net上采样层的特征。总时间步为1000,t越小越能捕捉几何特征,t越大越能捕捉语义特征
数据集:来自 ROCF(Rey-Osterrieth Complex Figure Test,雷-奥斯特列斯复杂图形测验)的实验数据集,一种经典的神经心理学测验,广泛用于评估个体的视觉-空间能力、记忆力以及执行功能。该测验通常要求被试者在没有时间限制的情况下临摹一幅复杂图形,以此评估其基本的视觉-空间能力和绘图策略。
评价指标:BQSS评分系统,BQSS(Boston Qualitative Scoring System,波士顿定性评分系统)进行评分。BQSS 通过分析绘图的完整性、空间组织性、结构性错误等多方面指标,给出打分
创新点:首次将扩散模型特征提取方法用于手绘图像的匹配工作
调参过程:由于是在sd的上采样层提取特征,因此从哪一层提取很重要,越低的层包括越多的语义信息,越高则包括越多的几何信息,这里的sd共有三层上采样层。同时扩散的时间步也很重要,t越小越能捕捉几何特征,t越大越能捕捉语义特征。由于数据类型固定,通过人工调参,发现在第二个上采样层、timestep为120左右时效果最好
kaggle竞赛 Plant Pathology 2021 - FGVC8 取得排名140/625
根据植物叶判断疾病的多标签分类任务,利用深度神经网络和一些训练方法,提升准确率
模型:efficient-b4:通过复合缩放扩展的模型,按一定规则同时扩展网络的层数、通道数、图像分辨率。
创新点:基于上述模型,利用自蒸馏、余弦退火学习率、测试时增强等方法提高准确率
评价指标:F1值 = Precision和Recall的调和平均值
模型调用:使用timm库创建模型
使用sigmoid激活函数,每个类别的概率独立计算,适用于多标签分类问题。而softmax通常用于二分类问题,因为每个概率互相依赖
自蒸馏技术:通过训练一个教师模型,生成教师模型的预测软标签,然后将软标签和硬标签进行加权平均,用于学生模型的训练。这种训练方式可以使标签包含更深层的数据特征,学生模型可以在教师模型学到的基础上继续学习,同时软标签的使用可以避免模型过分依赖groundtruth,降低过拟合的风险。
TTA:在测试时,对每个数据进行三次测试,每次随机使用一种数据增强方法,如裁切、旋转、亮度对比度变化等,取平均值作为该样本的最终预测结果。这种方法可以减少模型预测的随机性、提高准确率
基于Swin Transformer的医学图像分割网络
从传统transformer到vit到swin transformer到本文的u-net型swin transformer:
- 传统transformer用于语言生成,输入为token序列,
- vit将图片划分为patch,代替token,拼接出patch序列作为输入,但是图片的分辨率高时,会带来巨大的计算量,需要很多数据训练。
- swin transformer将encoding过程中的patch进行下采样,每层都减小特征的维度,并在decoding时上采样复原,减少很多计算量
另外,swin transformer不计算全局注意力,只计算一个窗口的注意力(W-MSA),然后在下一个block中移动窗口(SW-MSA)
swin transformer使用patch merging层在encoding过程中逐渐合并patch,并增大通道数C,最后进行图片分类,没有decoding过程。不计算全局注意力,而是在移位窗口中计算注意力,
- 基于u-net的swin transformer借鉴u-net的上采样和下采样过程,在原模型的基础上,在decoding时通过patch expanding一个线性层增加通道数,然后展开patch,最后输出对图像中器官分类的图片
上述就是本项目的模型,u-net型swig transformer
数据处理:synapse多器官分割数据集,3779张腹部临床CT图像,通过旋转和翻转等方式进行数据增强,构建pytorch的datasets类,重写__getitem__
训练方式:对模型预测的输出和label(这里的label是掩码,用于标注感兴趣区域,预测出的结果也是mask)计算交叉熵损失和dice损失(用于语义分割的经典损失函数),多项式衰减策略调整学习率,SGD优化器(加速收敛,添加L2范数防止过拟合,添加动量,减少梯度震荡)
评测指标:average Dice-Similarity coefficient (DSC) and average Hausdorff Distance (HD)平均 Dice 相似度系数 (DSC) 用来评估整体重叠区域,平均 Hausdorff 距离 (HD)用来衡量边界误差
回答时先感谢老师的问题,结束时说我的回答完毕
- 自我介绍需要准备一份稿子 3min
- ppt需要补充图片,以及内容的完善
- 英语需要多准备几份通用模板
- 不会的问题需要一个模板
- 复习408基础
- 复习ppt上的课程的内容
- 继续准备英语问题回答
- 往年的抽题了解
- 项目的模型结构和参数
自我介绍
各位老师好,我叫xx,本科就读于xx大学xx专业,很荣幸能够来到北大软微参加这次面试,希望各位老师多多指教。本科期间我主要围绕人工智能相关的课程进行学习,如模式识别与机器学习,神经网络与深度学习,自然语言处理,计算机视觉等,另外也学习了如操作系统,数据库系统原理,计算机网络,软件工程,数据结构与算法等与计算机相关的课程。这些课程为我未来更深入的学习打下了坚实的基础。
接下来我将从综合素养和项目经历两方面详细介绍。
首先是综合素养。在科研方面,我积极参与科研工作,以第二作者发表了论文《基于扩散模型生成数据的客户流失预测》,在这篇论文中,我们利用扩散模型的数据生成能力对表格数据进行增强,通过扩散模型生成的数据对原始数据进行重构,可以提升分类器的预测效果,如F1值,并且提升数据的隐私保护能力。在发表论文期间,通过设计与进行实验,以及数据的分析、论文的撰写,使我的科研能力得到提高。
然后是本科期间的个人奖项,xx。
下面是项目经历。在本科期间,我主要围绕人工智能相关方向进行项目实践。下面介绍三个项目。首先是基于扩散模型的手绘跨域图像匹配算法,也是我的毕业设计,在这个项目中,我利用扩散模型提取图像特征,具体方法如下图所示,对特征点进行稀疏匹配,用于患者精神疾病的诊断。
另外,我还尝试参与了kaggle的竞赛,这是一个根据植物叶图片判断疾病的多标签分类任务,我利用深度神经网络和自蒸馏、TTA,提升准确率,也取得了前25%的成绩。
最后是一个大模型的下游任务,基于Swin Transformer的医学图像分割网络,在Synapse 多器官分割数据集上进行微调,最终可以实现精准分割内脏器官。
在学习生活中,我一直对未知事物充满向往,未来我希望能够在人工智能领域继续深耕,探索更多的未知和可能。
我的自我介绍到此结束,感谢各位老师的倾听。
我是北京邮电大学人工智能专业的本科生王正阳,在思想政治方面,我是一名共青团员,积极学习马克思主义基本原理、习近平新时代中国特色社会主义思想,积极拥护党的领导。在外语方面,我通过了CET-6,有良好的英文文献阅读能力。本科阶段,我系统学习了人工智能及计算机科学相关的核心课程,熟练使用**Python、C/C++**等编程语言,负责或参与过许多项目,具备扎实的理论基础和实践能力。在科研方面,我有一段科研经历,参与发表一篇学术论文,具备一定的科研能力。
thanks for your question,professor
Those are all of my answers,thank you
I’m sorry, I didn’t hear the question clearly. Could you please repeat it?
感谢老师的提问。对于xx,我在之前的学习中接触的比较少,因此对此不太了解。根据我自己的理解,xx。我的理解可能有误,下去之后我会再系统学习这方面的知识。
adam优化、u-net、DDPM、项目3的评价指标、
adam是一种优化方法,在模型训练时,可以根据反向传播的梯度计算其一阶矩和二阶矩,动态调整学习率,可以达到更高效的收敛
为什么选择我们学校
二零二四年三月,我正式开始复习考研,至今已有一年。通过这一年的努力,有幸争取到踏入北京大学复试的机会,复试在即,内心始终无法平静,如同今晚北京的风,呼啸着裹挟空气而去。
回顾这一年的经历,只记得自己日复一日坐在图书馆的实木桌椅上,却想不起来到底看了哪些书,做了哪些事,就如同那时的自己无法想到复试前自己的心情一样。刚开始时雄心壮志、浑身干劲,也被时间渐渐抹去,如今只盼望复试早点过去,希望自己能完成这段任务,心中的那团热火,渐渐地也烧干成一堆灰烬。图书馆前的玉兰花再次盛开,和往年开的同样热烈,却没有心情再拿出相机摄下。回顾这一年,其实和以往的任何一年没有什么不同,可我为何如此看重这次复试?也许它能决定我的未来,真的如此吗?或许只是因为它标志着一个阶段的结束······我的美好的学生阶段结束了。又或许,这天确实别的一天没什么不同,还是每天做了自己应当做的事罢了。
那可能是晴空万里的一天,可能是狂风呼啸的一天,可能是阴雨连绵的一天,只消走入那间屋子,写一些想写的、说一些想说的,这天便结束了。过程是如此的简单,波澜不惊,事实也正是如此。走出那扇门时,我的心情是怎样?断然比此前都好些吧,不论如何,内心总会晴空万里。也许这就是这一年的意义。