如何提高视觉场景理解能力?NVIDIA研究院研究员禹之鼎将直播讲解!

2019年9月10日08时55分内容来源:智东西

在完结26场超级公开课NVIDIA专场后,自7月起,智东西公开课联合NVIDIA研究院推出了NVIDIA研究院系列专场,共计四讲,分别是生成式对抗网络GAN专场、图像转换专场、视觉场景理解专场和图像修复专场。其中生成式对抗网络GAN专场和图像专场已经完结,而视觉场景理解专场和图像修复专场也将分别在9月11日和9月25日开讲。


视觉场景理解是在环境数据感知的基础上,结合视觉分析与图像处理识别等技术手段,通过挖掘视觉数据中的特征与模式,实现场景有效分析、认知与表达的过程,是实现自动驾驶、车辆导航,智能机器人等应用的关键技术之一。


在深度学习时代,有监督的深度学习模型在视觉场景理解中虽然拥有很好的效果,但依赖于大量的标准数据,然而数据本身的标注成本是极高的。比如在PASCAL VOC数据集中,需要十余名工人来标注27374个边界框,而对于ImageNet甚至需要25000名人员对上千万张数据进行标注。


而在后深度学习时代,我们可以通过弱监督学习来实现基于视觉的场景理解。弱监督学习是研究者们面对急需解决的数据标注问题,整合了现有的主动学习、半监督学习等研究成果,提出的新概念,旨在研究通过较弱的监督信号来构建预测模型。


9月11日13点,NVIDIA研究院研究员禹之鼎将在智东西公开课主讲《如何使用弱监督学习提升视觉场景理解能力》,为你揭开弱监督学习提高视觉场景理解能力的秘密。禹老师将从弱监督学习的研究现状、视觉场景理解所面临的挑战、如何使用弱监督学习提升视觉场景理解能力等方面,为我们系统性的分析和讲解弱监督学习,你不可错过!


开课时间

时间:9月11日13点

地点:智东西公开课直播间


讲师介绍

禹之鼎,2018年以研究员身份加入英伟达研究院。在此之前,他于2017年和2012年从卡内基梅隆大学以及香港科技大学分别获得电子计算机工程博士和硕士学位。目前的研究方向主要包括深度表达学习,弱监督/半监督学习,迁移学习,结构化预测,以及这些方向在语义/实例分割,边缘检测,物体检测,领域自适应(Domain Adaptation),领域泛化(Domain Generalization)等方向的应用。他曾获WAD18语义分割领域自适应挑战赛第一名,ISCSLP14最佳学生论文以及WACV15最佳论文。在微软研究院实习期间的工作获得了EmotiW15静态人脸表情识别挑战赛第二名并成为微软Azure认知服务下表情识别API的一部分。现已在CVPR, ICCV, ECCV, NeurIPS, ICML, AAAI, IJCAI, ACM-MM等主要会议上发表了十几篇论文。


课程内容

主题:如何使用弱监督学习提升视觉场景理解能力

提纲:

1. 弱监督学习研究现状

2. 弱监督学习在视觉场景理解中的挑战

3. 提升弱监督学习视觉场景理解能力的方法


加入主讲群

每场讲解我们都将设置主讲群,并会邀请主讲导师入群。加入主讲群,你除了可以免费收听直播之外,还能直接和讲师认识及交流。当然,你还可以结识更多的技术大牛。想要加入主讲群的朋友可以扫描海报底部的二维码添加小助手大越(ID:xdxaxx)进行申请,备注“姓名-公司\学校\单位”的朋友可以优先审核通过哦。


适合人群

1、自动驾驶、智能机器人、无人机、互联网等行业的技术从业者与中高层。

2、计算机视觉相关算法工程师
3、从事计算机视觉、深度学习、无监督学习、弱监督学习的科研人员、老师、学生


快速入群通道

心急的小伙伴可以扫描下方二维码填写主讲群申请表,将获得快速入群资格哦。



点个“在看”和大家一起聊聊



最值得关注的微信公众号