教育经历
北京邮电大学 计算机科学与技术 硕士
2021年09月 - 2024年06月
- 研究方向:暗弱光(恶劣)场景语义感知、人脸人体解析、迁移学习
- 加权平均分92.32,gpa3.8/4.0,获得2次一等奖学金,1次国家奖学金
北京邮电大学 智能科学与技术 本科
2017年09月 - 2021年06月
- GPA: 3.52/4.0,排名10/61,保研,曾获北京邮电大学数学竞赛三等奖、全国大学生数学竞赛三等奖、北邮大学生创新实践成果展示交流会暨创新论坛奖三等奖,校级三好学生、优秀学生干部、优秀毕业生,持续获得国家励志奖学金
- 主修课程:机器学习、数据结构、人工智能原理等
工作经历
百度-多模搜索组-ai搜多模态优化
2025年06月 - 至今
- 识图理解能力优化
- 文生图能力优化
百度-多模搜索组-识图双列流排序优化
2024年05月 - 至今
- 通用排序
- 相关性模型迭代
- 3.0:
- 4.0:
- 排序模型迭代
- NNRank
- 相关性模型迭代
- 垂类排序
- 策略优化
- 商品垂类优化
- 动植物、人物垂类排序优化
- 策略优化
学术成果
ICDA: Illumination-Coupled Domain Adaptation Framework for Unsupervised Nighttime Semantic Segmentation
【第一作者 CCF-A IJCAI2023】
- Motivation:为解决夜间场景语义分割的数据不足和光照条件差的问题,首次提出基于光照耦合的域对迁移,提升了迁移效果和夜间场景感知能力
- Contributions: 1.**构造基本迁移单元:提出了复合增强模块,同时考虑光照和空间差异来构造源域对和目标域对 2.避免光照差异:提出跨域可变形注意力机制捕获语义相关性,作为耦合白天和夜间场景的桥梁,同时指导夜间图片的预测 3.降低数据集差异:提出基于原型的类别对齐模块来实施细粒度对齐,捕获域不变的语义相关 **4.**在Dark Zurich、BDD100k-night等主流夜间分割数据集上达到SOTA(58.2%、38.9%)** ,相比现有sota模型均提高**2%**mIoU
实习经历
快手社科-直播推荐部-潜力主播扶持
2023年06月 - 2023年09月
- 工作内容:潜力主播扶持,提升营收1w+主播数
- 1.0:筛选主播相关特征,采用分桶预估方案,采用xgboost和ple等模型对主播的营收、公域营收、ltv和cpm进行建模,根据预估值和相关策略进行主播圈选,产出多个主播池构成B端队列,万元户主播数提升约3%
- 2.0:ple等模型对主播的营收、公域营收、ltv和cpm进行建模
商汤MIG-智能感知终端
2023年04月 - 2023年06月
- 项目:与sony公司合作的针对IMX500传感器感知算法研究
- 背景:RAW数据相比RGB数据具有更深的数据位深、且不受ISP非线性变换影响,对恶劣场景(暗弱光等)鲁棒性更强
- 工作:研究RAW域数据增强,在不额外采集数据的情况下增强模型对恶劣场景感知的鲁棒性
- 解决方案与效果:使用物理噪声模型建模传感器噪声进行噪声增强,通过光源采样进行亮度增强,不额外采集数据情况下使恶劣场景下整体人脸检测效果提高2.4%,身体检测效果提高3.1%
传音影像部(北邮-传音联合实验室项目)
2021年09月 - 2023年03月
负责内容1:研发针对移动端图片的实时人脸人体解析模型并解决数据不均衡问题
- 解决方案:数据不均衡: 调研并制定标注规则,自建深肤色人像数据集;模型构建:利用位置感知注意力、边缘检测分支、OHEM困难样本挖掘、深层次监督等解决分割不连续、边缘不贴合、人脸分割精度差等问题,同时利用mobilenetV3构建轻量化backbone,满足移动端要求
- 工作产出:1.大型精确标注深肤色人像数据集共1000张 2.实时人体检测模型,人脸精度达89.29%**,FPS达140,模型大小2.9M** 3.实用专利:《图像处理方法、智能终端及存储介质》
负责内容2: 研究暗弱光场景下的图像分割和增强算法,并解决模型效果退化、数据不足的问题
- 工作产出:1.CCF-A IJCAI2023 oral,在主流数据集达到sota**(58.2%,38.2%),同时在静态和动态类上取得最优 2.**实用专利:《一种暗弱光语义分割方法和装置》
其他技能
- 专业技能:Python,C/C++,Pytorch/Tensorflow框架下的模型搭建及调优,常用的linux、sql语法,git和github项目管理等
- 英语:CET-4 582分,CET-6 556分
- 组织能力:曾担任学委、团支书、团委组织部副部长,志愿时长达100小时,组织沟通能力较强