北航孙钰:昆虫目标检测技术

栏目:高等教育  时间:2023-02-06
手机版

  不到现场,照样看最干货的学术报告!嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。

  人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术、paperweekly作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。2020年4月26日,第14期“AI未来说·青年学术论坛”深度学习线上专场论坛以“线上平台直播+微信社群图文直播”形式举行。北京航空航天大学孙钰带来报告《昆虫目标检测技术》。

  孙钰,北京航空航天大学大学网络空间安全学院副教授,北京林业大学信息学院兼职硕士导师。2018及2019年C4-AI创意赛一等奖团队指导教师,同时获优秀指导教师奖。2019年全国大学生物联网设计竞赛一等奖团队指导教师。主持教育部-谷歌校企协同育人项目两项,教育部-百度校企协同育人项目一项。主要研究方向为智能物联网AIoT、生物特征识别、智能安全。

  报告内容:以2018年C4-AI创意赛一等奖作品《智能虫情监测物联网》为例,介绍人工智能+生态的典型项目,讲解针对林业害虫红脂大小蠹的目标检测技术,内容覆盖数据采集、模型设计、飞桨软硬件选型、物联网部署等完整流程。

  昆虫目标检测技术

  孙钰老师主要就2018年的C4-AI创意赛一等奖作品《智能虫情监测物联网的解析》进行了分享,主要包括三个部分:研究意义、系统设计、创新点总结,每一个部分又包括了作品介绍、得分点分析以及飞桨资源指南。为了便于大家理解,孙老师形象地解释道:如果把参赛比作神经网络的训练,作品介绍就是引领大家做选项预测,得分点分析帮大家计算损失,最终根据飞桨资源更新参赛的参数。

  首先,孙钰老师讲解了该作品的研究意义。其研究对象是红脂大小蠹,它是一种危害了35种松科植物,发生面积超过50万公顷的入侵害虫。红脂大小蠹之所以难于防治就是因为它的隐蔽性,它是一种蛀干害虫,从外观上看只能看到一些虫粪,只有扒开树皮才能看到里边的害虫。在扬飞期对红脂大小蠹进行数量和种群的统计是进行准确预报的重要环节,在林学专业的工具叫信息素诱捕器。传统监测方式还是人工上山的监测方式,需要专业工作人员定期上山回收每一个诱捕器点清里边的诱捕数,这项工作工作量非常大的,因此急需自动化监测工具来提高虫害预警及防治准确率和效率。这部分的得分点是选题抓住了人工智能+X,比赛采用开放性命题。围绕行业需求,孙钰老师的课题选择了重大入侵害虫红脂大小蠹,并做到人工智能+生态的结合。孙钰老师建议同学们在进行比赛时,要学会组建跨专业的团队,以他的团队为例,团队队员来自林业信息化、人工智能和物联网专业,从而从组队上保证了人工智能+生态的组合。此外,关于选题方面,孙钰老师提到,飞桨提供了很多的参考案例,推荐同学们到百度AI开放平台官网去查询,比如说高尔夫球场的监测,更低地块的识别等等,供大家启发思维。

  接下来,孙钰老师从技术路线和效果展示两方面详细地介绍了系统设计。他们使用了飞桨框架,训练了一个目标检测模型,这个模型被部署到了嵌入式设备上,嵌入式设备上除了有CPU还有摄像头,可以在诱捕器里采集图像、拍照、调用模型识别,识别完以后识别结果会通过物联网传输到云端服务器上,这样在云端可以在百度地图上看到森林各处的情况。

  孙钰老师还为大家介绍了零基础入门飞桨的方法:一般来说零基础预计需要3—4周的时间。首先要有一周学习python,然后可以观看百度云智学院的视频教程“90分钟飞桨快速上手”,之后可以转为学习百度官方的文字教程,因为只有百度飞桨目前是全中文资料,孙钰老师推荐从中文资料入手。学完之后即使没有GPU资源,也可以用AI Studio实际演练。

  之后,孙钰老师详细讲解了参赛作品。第一步,团队对诱捕器进行了电子化的改造。,首先在诱捕器收集杯中集成LED灯带用来补充光照,然后要集成摄像头并调整焦距,以此在诱捕器底部得到清晰的成像。图像识别主要有两个挑战:其一,目标姿态各异,而且有些是破碎的;其二,时间一长诱捕器会落入杂质,导致背景非常嘈杂。借助诱捕器的电子化改造,该团队结合了应用场景并且自行获取了相关数据。在数据标注时,该团队选择了LabeIImg。根据林学院的建议,孙钰老师团队用边界框标识出了红脂大小蠹的位置。之后,团队对数据集进行划分,划分为训练集、验证集和测试集。这样采集的图片、标注格式尽可能利用飞桨已经实现的DataRader,可以大幅度减少编程工作量。

  团队站在巨人的肩膀上,以飞桨模型SSD模型为基础,充分利用已有DateReader、模型定义、预训练模型以及测试训练代码。但是最初SSD是面向PASCAL VOC等通用数据集,它的任务是检出像猫一样的通用物体,而将它转移到专业小目标精细分类多重检测的时候,需要对算法进行优化。首先需要对运算量进行精简。这部分主要体现对骨干CNN运算量的精简,降低运算量方式主要是MobileNet的深度可分离卷积,用深度可分离卷积替代标准卷积,可以大幅压缩CNN阶段的运算量。第二,对于定位进行优化。蠹虫的体积非常小,这时候需要改变SSD模型超参数,把输出特征图尺寸扩大一倍,大小到64×64,团队采用了特征金字塔把高层特征向下融合,为低层抽象特征图补足语义信息,两个高分辨率的特征图上输出分类和定位结果。最终是对于品种细分头部优化,这里增加了卷积的层数,并且加入了残差连接,这样一来模型不仅可以找出蠹虫在哪儿,而且知道蠹虫到底是不是有危害的红脂大小蠹。

  最后团队把模型变成了AIoT中的模型。因为林区移动信号差,无法上传高清图片,因此团队把模型下发到每一个诱捕器上,摄像头定时拍摄诱捕器中蠹虫影像,交给身边嵌入式去识别。在上报过程中,仅需要通过轻量级MQTT协议上报识别结果就可以,避免了在林区网络下上传高清图片,这样就把传统没有任何电子设备的诱捕器变成了智能终端。林区各个诱捕器在定时拍摄识别以后会将结果通过MQTT协议上报,MQTT中转器会把每个客户端消息发布到订阅者,订阅者是林草局监控服务器,服务器收到之后会把数据写入数据库,然后在前端地图更新,这样一来林业专家就可以在远程看到林区各个点实时的虫情。这方面的得分点是把模型部署到智能物联网中。关于将模型转化为物联网,孙钰老师介绍了两大工具:一个是硬件EdgeBoard,EdgeBoard上运行的是轻量级深度学习框架Paddle Lite,可以把它想成ARM版的飞桨;向嵌入式部署模型还需要专门的部署软件Paddle Lite,模型导出后需要压缩才能让Paddle Lite运行。

  模型设计好之后,在云端的效果是这样的:打开百度地图,每一个诱捕器是一个气泡,点开可以看到里边采集时间和数量,如果虫情严重气泡就会变成红色。云端对应得分点是可视化应用展示。然后孙钰老师分析了作品的市场应用前景,这套设备具有低人力、高效率、低成本的特点,有比较好的应用前景。

  最后,孙钰老师总结了该作品的创新点。首先是强化了原始SSD的细分能力,让它可以识别诱捕器中任意姿态的小目标蠹虫,检出唯一有危害的红脂大小蠹。第二精简原始SSD模型的运算量,并且用Paddle Lite把它部署在潜入式开发板上,实现了林区本地识别。第三是使用MQTT协议汇聚各个诱捕器虫情,然后汇聚到云端进行可视化的展示,为林区制定防治措施提供数据支撑。

  报告结束,孙钰老师不忘给大家分享学习飞桨的心得。他提到,飞桨官方提供了非常好的指南,大致可以分为三个部分。首先是入门教程,它的难度相当于小学语文课本。然后是实验案例,孙钰老师推荐大家选计算机视觉、自然语言来实际练兵,练兵过程中碰到不知道的API,可以到API reference查字典。经过读教材、做实验、查字典的过程,大家可以通过案例快速提升人工智能技术。对于中国开发者来说,一个额外福利是可以向飞桨开发者直接提问,即在GitHub发出issue。在提问的时候直接写中文就可以,百度工程师一般会在一两天的时间给出非常及时的回复。

  AI未来说*青年学术论坛

  第一期 数据挖掘专场

  1. 李国杰院士:理性认识人工智能的“头雁”作用

  2. 百度熊辉教授:大数据智能化人才管理

  3. 清华唐杰教授:网络表示学习理论及应用

  4. 瑞莱智慧刘强博士:深度学习时代的个性化推荐

  5. 清华柴成亮博士:基于人机协作的数据管理

  第二期 自然语言处理专场

  1. 中科院张家俊:面向自然语言生成的同步双向推断模型

  2. 北邮李蕾:关于自动文本摘要的分析与讨论

  3. 百度孙珂:对话技术的产业化应用与问题探讨

  4. 阿里谭继伟:基于序列到序列模型的文本摘要及淘宝的实践

  5. 哈工大刘一佳:通过句法分析看上下文相关词向量

  第三期 计算机视觉专场

  1. 北大彭宇新:跨媒体智能分析与应用

  2. 清华鲁继文:深度强化学习与视觉内容理解

  3. 百度李颖超:百度增强现实技术及应

  4. 中科院张士峰:基于深度学习的通用物体检测算法对比探索

  5. 港中文李弘扬 :物体检测最新进展

  第四期 语音技术专场

  1. 中科院陶建华:语音技术现状与未来

  2. 清华大学吴及:音频信号的深度学习处理方法

  3. 小米王育军:小爱背后的小米语音技术

  4. 百度康永国:AI 时代的百度语音技术

  5. 中科院刘斌:基于联合对抗增强训练的鲁棒性端到端语音识别

  第五期 量子计算专场

  1. 清华大学翟荟:Discovering Quantum Mechanics with Machine Learning

  2. 南方科技大学鲁大为:量子计算与人工智能的碰撞

  3. 荷兰国家数学和计算机科学中心(CWI)李绎楠:大数据时代下的量子计算

  4. 苏黎世联邦理工学院(ETH)杨宇翔:量子精密测量

  5. 百度段润尧:量子架构——机遇与挑战

  第六期 机器学习专场

  1. 中科院张文生:健康医疗大数据时代的认知计算

  2. 中科院庄福振:基于知识共享的机器学习算法研究及应用

  3. 百度胡晓光:飞桨(PaddlePaddle)核心技术与应用实践

  4. 清华大学王奕森:Adversarial Machine Learning: Attack and Defence

  5. 南京大学赵申宜:SCOPE - Scalable Composite Optimization for Learning

  第七期 自动驾驶专场

  1. 北京大学查红彬:基于数据流处理的SLAM技术

  2. 清华大学邓志东:自动驾驶的“感”与“知” - 挑战与机遇

  3. 百度朱帆:开放时代的自动驾驶 - 百度Apollo计划

  4. 北理宋文杰:时空域下智能车辆未知区域自主导航技术

  第八期 深度学习专场

  1. 中科院文新:深度学习入门基础与学习资源

  2. 中科院陈智能:计算机视觉经典——深度学习与目标检测

  3. 中科院付鹏:深度学习与机器阅读

  第九期 个性化内容推荐专场

  1. 人民大学赵鑫:基于知识与推理的序列化推荐技术研究

  2. 中科院赵军:知识图谱关键技术及其在推荐系统中的应用

  第十期 视频理解与推荐专场

  1. 北京大学袁晓如:智能数据可视分析

  第十一期 信息检索与知识图谱专场

  1. 北京邮电大学邵蓥侠:知识图谱高效嵌入方法

  2. 人民大学徐君:智能搜索中的排序-突破概率排序准则

  3. 百度周景博:POI知识图谱的构建及应用

  4. 百度宋勋超:百度大规模知识图谱构建及智能应用

  5. 百度冯知凡:基于知识图谱的多模认知技术及智能应用

  第十二期 年度特别专场

  1. 复旦大学桂韬:当NLP邂逅Social Media--构建计算机与网络语言的桥梁

  2. 清华大学董胤蓬:Adversarial Robustness of Deep Learning

  3. UIUC罗宇男:AI-assisted Scientific Discovery

  4. 斯坦福应智韬:Graph Neural Network Applications

  第十三期 AI助力疫情攻关线上专场

  1. 清华大学吴及:信息技术助力新冠防控

  2. 北京大学王亚沙:新冠肺炎传播预测模型

  3. 百度黄际洲:时空大数据与AI助力抗击疫情——百度地图的实践与思考

  4. 百度张传明:疫情下的“活”导航是如何炼成的

  留言点赞关注

  我们一起分享AI学习与发展的干货

  如转载,请后台留言,遵守转载规范

  举报/反馈

上一篇:南阳师范学院2022年地方公费师范生本科层次定向招生分布表公布
下一篇:上海工科类高校排名,华东理工大学第二,东华大学第三,第一是谁

最近更新高等教育