图像识别原理人工智能(8月顶级CV大会)
图像识别原理人工智能(8月顶级CV大会)在传统的计算机视觉研究中,我们谨慎地剥离和忽略了原声带;同样,在传统的音频分析上忽略了视频中可用的视觉信息。本报告将描述如何通过在视频中使用视觉和音频来获得更好的场景理解;并用一个例子说明,如何使用显示说话者面部的视频来增强音频分析;同时,报告中还会用「视频监控」案例来展示音频对场景活动理解的加强作用。报告题目二——《Improved Scene Understanding by Combining Sight and Sound》如果一个框架由三个「棒」(相同长度)在一个共同点上相交所组成,其中我们感兴趣的是表示框架的方向和「形状」。方向是相对于参考系的旋转;而「形状」是相对于参考系的变形。事实证明,任何框架都可以通过莫比乌斯变换转换为任何其他框架。该观点揭示了旋转是单位四元数。单位四元数是广为所知的,并且在空间旋转的表示中非常有用,因为它们在变量中是连续的,在连续表示中至少需要四个坐标
雷锋网 AI 科技评论按:2019 年 8 月 23 日至 25 日,第 10 届国际图像与图形会议(International Conference on Image and Graphics,简称为 ICIG)将于中国北京举行,会议由中国图象图形学学会主办,清华大学、北京大学和中国科学院自动化研究所承办,并得到了国际模式识别协会(IAPR)的支持。
ICIG
ICIG 每两年一次,是中国图象图形学学会主办的最高级别的系列国际会议,迄今已经成功举办了九届。会议重点关注关于图像、视频和图形处理的创新技术,以及促进创新、创业和网络化相关工作。
本次会议的主题为「人工智能时代的图像图形前沿研究」,将邀请国内外图像图形学领域的 3 位著名学者作大会特邀报告,集顶刊顶会论文报告、前沿科技产品展示、6 个前沿专题论坛。
3 个特邀报告
-
报告题目一——《The Shape of Deformations》
如果一个框架由三个「棒」(相同长度)在一个共同点上相交所组成,其中我们感兴趣的是表示框架的方向和「形状」。方向是相对于参考系的旋转;而「形状」是相对于参考系的变形。事实证明,任何框架都可以通过莫比乌斯变换转换为任何其他框架。
该观点揭示了旋转是单位四元数。单位四元数是广为所知的,并且在空间旋转的表示中非常有用,因为它们在变量中是连续的,在连续表示中至少需要四个坐标的意义上是最小的,并且它们具有允许允许测量变形量的自然度量,即角度。莫比乌斯变换的观点也揭示了这是该项工作新的一面,变形是双曲面上的点。所以「形状」可以被描述为双曲空间中的一个点。这是一种表示,就像单位四元数一样,是连续的、微小的,并且具有允许测量变形量的自然度量。
报告者:柏林工业大学,Marc Alexa
-
报告题目二——《Improved Scene Understanding by Combining Sight and Sound》
在传统的计算机视觉研究中,我们谨慎地剥离和忽略了原声带;同样,在传统的音频分析上忽略了视频中可用的视觉信息。本报告将描述如何通过在视频中使用视觉和音频来获得更好的场景理解;并用一个例子说明,如何使用显示说话者面部的视频来增强音频分析;同时,报告中还会用「视频监控」案例来展示音频对场景活动理解的加强作用。
报告者:希伯来大学,Shmuel Peleg
-
报告题目三——《Low quality fingerprint recognition》
指纹识别是最广泛使用的生物识别技术之一。尽管其应用广泛,但低质量指纹的识别率,例如老年人的指纹、犯罪现场的潜在指纹以及非常干燥或潮湿的手指指纹,仍然远不能令人满意。本报告将介绍研究者们最近在低质量指纹识别方面取得的进展,包括指纹增强、皮肤畸变校正和稠密配准。
报告者:清华大学,周杰
2 个讲习班
-
Visual SLAM and 3D Reconstruction
《Visual SLAM》:Visual SLAM 是 3D 视觉和机器人领域的基本问题,可以在未知环境中同时恢复姿势和 3D 结构,它具有广泛的应用。本教程将首先介绍一些基本概念和原理,如相机模型和多视图几何,然后介绍 VSLAM / VISLAM 的主流框架以及一些重要的模块,如特征跟踪、姿势估计、束调整和循环闭包。此外,课程还将推出新的增强现实 VISLAM 基准,介绍一组基于 VSLAM / VISLAM 技术的 AR 应用程序。
讲师:浙江大学,张国锋
《基于图像的三维重建》:由于计算机视觉在 20 世纪 70 年代成为一门独立的学科,在 50 年的研究中,图像的 3D 表示,即 2D 图像的场景 3D 重建一直是计算机视觉研究中的经典和基本问题。近年来,随着图像采集设备的不断发展,利用数码相机、街景车、无人机等设备获取大量高分辨率图像变得方便。如何通过这些图像构建我们的 3D 世界已成为许多应用的迫切需求。因此,在理论和应用层面,基于图像的三维重建已成为计算机视觉研究人员的热点。本教程将介绍基于图像的 3D 建模的基本流水线和关键算法,包括运动结构,多视图立体声,点网格划分,语义建模等。此外,我们将展示文化遗产数字化的几个 3D 重建演示,智能城市,高清地图和基于 3D 地图的视觉重新定位。
讲师:中国科学院自动化研究所,申抒含
更多关于讲师信息:
张国锋
http://www.cad.zju.edu.cn/home/gfzhang
申抒含
http://vision.ia.ac.cn/Faculty/shshen/index.htm
-
Plenoptic Face Analysis
人脸分析是机器学习和计算机视觉领域的重要研究课题之一。它在智能手机、金融支付、公共安全、互动娱乐等方面具有广泛的应用。通过编辑、合成和生成新的人脸图像,不仅可以提高原始人脸图像的质量,而且可以增加人脸数据规模,从而提高现代人脸识别系统在复杂环境中的鲁棒性。
全光面部分析包含视觉面部图像的收集、重建、编辑、解释和识别。研究内容大致分为理论和应用。理论研究包括图像采集、深度学习、转移学习、弱监督学习等,应用研究涉及人脸对齐、人脸轮换、表情合成、属性编辑等。基于视觉信息获取和深度学习框架,教程深入分析了全光面部分析的理论和应用。
首先,基本部分将从全光计算摄影、视觉拓扑认知、概率生成模型和身份保存结构等方面介绍深度全光人脸分析所涉及的主要理论和方法。然后,应用部分将深入探讨特定的应用场景以及面部生成、面部旋转、年龄合成、光场成像等方面的最新进展。相关研究发表在几个顶级期刊和会议上,如 IJCV,IEEE TPAMI,TIP,TIFS,ICCV,CVPR,ECCV,NeurIPS,AAAI。
Plenoptic Face Analysis 讲师
2 个技术竞赛
一、智能交通视频图像增强处理竞赛
-
竞赛背景
视频和图像传感技术在智能交通中应用越来越广泛,这些应用的效果很大程度上依赖采集图像的质量。然而,智能交通系统运行环境复杂,在雾/雾霾等恶劣天气下采集的视频或者图像会发生严重的质量退化,难以满足实际应用需求。因此,需要采用图像增强算法对在雾/雾霾、雨、雪等恶劣天气下采集的低质量图像进行去噪增强处理,以改善图像的视觉效果、提升后期图像识别的精度。
此项竞赛依托第十届国际图象图形学学术会议,由北京和普威视科技股份有限公司冠名支持,旨在吸引国内外图形图像领域及智能交通领域的研究人员,结合计算机领域的技术优势和智能交通领域的专业知识,共同搭建具有实际应用价值的服务于智能交通领域的图像增强技术。参赛获胜队伍可获得获奖证书和奖金,同时和竞赛组织者合写一篇总结论文发表于顶级刊物。
该竞赛作品提交截止至 8 月 5 日,在 8 月 12 日将公布竞赛结果,并在 8 月 23 日至 25 日 ICIG 2019 大会期间进行竞赛颁奖。
-
数据集
竞赛方提供了一组训练集和验证集,该训练集和验证集来自「Benchmarking Single Image Dehazing and Beyond」。训练集和验证集共包括 5500 张合成的雾图、清晰的图像以及深度信息,之后还有一个由 20 张真实世界的轨道交通监控雾霾图像组成的测试集会发布。
-
竞赛流程
-
训练:提供图像去雾/雾霾的训练集,但不限定训练集。
-
验证:提供图像去雾/雾霾的验证集,验证集与训练集由不同图像和参数合成得到。
-
测试:测试集稍后公开发布,但与验证集性质相似。
-
环境:不限定测试环境。
-
评测:参赛方在规定时间提交测试集处理结果,获胜者需提交图像去雾/雾霾处理代码,由组织方在测试代码并得到最终的处理效果和处理速度,两者排名均靠前者为优胜,所有评测结果均在网上及时发布。
二、小目标与遮挡物体检测竞赛
-
竞赛背景
遮挡和小物体是物体检测任务的难点之一,尤其是在监控、自动驾驶和视觉感知的应用场景中。因此,该 Workshop 特别设置了遮挡图像识别和小物体检测两个竞赛单元,从而更好的促进计算机视觉领域的发展。
-
小目标检测数据集
数据集基于虚拟仿真环境创建,模拟无人机在低空飞行时,对城市道路上行驶的多种车辆进行航拍并收集可见光图像。识别目标为公路上的车辆,其中包括 12 种车辆(BMW、Nissan、Mustang、Mini、Volkswagen、Policcar、Lincoln、Tazzar、Jeep、Truck、Bus、SUV),并且同时考虑四种成像条件:两种天气条件(晴天和雾天)以及两种光线条件(白天和黄昏)。
特别强调,图像数据中树木或建筑物对目标车辆有不同程度的遮挡,对于极其严重的被遮挡目标(遮挡率超过 90%),依然给出其 BoundingBox,即该遮挡目标包含于被识别目标 GroundTruth 中,参与最终模型评估。
-
遮挡目标检测数据集
遮挡目标检测数据集包含了人、车、船、飞机四个大类,每类训练和验证集包含 10 张真实遮挡图像,50 张多源仿真图像以及 1000 张同源仿真图像,测试集约 500 张(以实际数量为准,详见文档更新)。其中多源仿真图像指来自于各种游戏、仿真数据集等场景的遮挡图像,同源仿真图像为使用本实验室仿真平台生成的遮挡图像。数据集标注包含了图像中对应类别的全部物体,被遮挡物体的遮挡面积等信息。
6 个论坛
论坛一:顶会顶刊经验交流分享
简介:图像图形学领域,每年国内外发表了大量学术论文,佳作涌现、新人辈出。如何在这个群贤争鸣的时代做出有特色的的高水平研究、发出自己的声音、乃至脱颖而出,是一个广大科研工作者、特别是青年学者值得思考的问题。本论坛邀请在图像图形学领域从事多年一线研究和应用的青年才俊,分享自己在顶会顶刊方面的相关成果,特别是形成自己研究特色和学术标签的心路历程和研究经验。
论坛二:优博论坛和青托论坛
简介:本论坛围绕图像图形基础理论与应用研究的前沿课题,开展学术交流和技术研讨,旨在为广大青年学者提供一个学术交流与合作的舞台,增强优秀青年人才的活力与凝聚力,促进图像图形学领域优秀青年人才的成长,展示青年人才的最新研究成果,激发青年科学家的创新性,促进和提升我国图像图形学的科技水平和人才培养。
论坛报告讲者及主持人主要来自于由 CSIG 推荐的中国科协青年人才托举计划入选者代表以及 CSIG 优秀博士学位论文获得者代表,在普及图像图形科技知识、探索前沿高新技术与应用推广、职业发展等方面开展交流与研讨,对于我国图像图形基础理论及学科技术的应用发展具有重要的推进作用。
本论坛将充分发挥学术引领作用,通过开展学术报告和研讨的方式吸引广大青年学者加入论坛,营造高层次、高水平的学术交流环境,就图像图形学科发展动态和研究热点进行探讨,分析青年学者在图像图形学领域面临的机遇、挑战以及肩负的使命,启迪新的学术思想和创新,共话未来。
论坛三:快速视觉通路论坛
简介:快速侦测环境中的危险并进行下意识的防御反应对于生物体在自然界中的生存是至关重要的。目前广泛认为上丘和枕核等皮下脑核团共同构成了一条快速视觉通路,能够在警觉意识产生之前粗略地将危险相关的视觉信息迅速传递到杏仁核,从而引起生物体的防御反应。本论坛以快速视觉通路为主题,旨在推动皮下视觉通路研究的发展,并加深对大范围优先神经环路表达机制的理解。论坛将邀请本领域多位国内顶尖学者作报告,介绍他们的研究成果,分享他们的研究经验,为从事相关研究的广大教师和学生提供一个学术交流与合作的平台。
论坛四:第三届视觉大数据高峰论坛
简介:全球视觉数据正在呈现爆炸式的增长,给视觉大数据的处理带来了前所未有的挑战,同时也给视觉技术的应用带来了巨大的机遇。本论坛旨在通过科研工作者、行业企业精英等视觉数据领域一线研究者之间的学术交流,共同分享我国视觉领域的最新理论和技术发展、深入挖掘视觉大数据中蕴含的价值,共同探讨视觉技术领域发展的新模式,对推动视觉大数据领域的理论创新、行业发展,以及促进领域间的交流具有重要的意义。首届论坛在北京中科院自动化所举办、第二届论坛在广州白云国际会议中心举办,来自全国各地高等院校、科研机构、企业的近 300 位精英出席,得到了社会各界的广泛关注。
论坛五:类脑智能论坛
简介:类脑智能是利用神经计算来模拟人类大脑处理信息的过程,被认为是下一代人工智能的重要方向,也是当前人工智能领域的热点方向。人工智能的发展需要真正地了解大脑,学习大脑的思考方式。那么,到底机器人会不会拥有像人类一样的智能?对于大脑的借鉴和研究,一直是人工智能发展的一个方向,而实现具有人类意识的人工智能更是人类长久以来的目标。本论坛我们将邀请6位专家从不同的角度来介绍类脑智能的研究进展、类脑研究中的难点问题,并对今后的研究进行展望。
论坛六:女科学家学术论坛
简介:中国图象图形学学会女科技工作者委员会致力于鼓励、推荐、扶持图像图形领域的优秀的女性学者与年轻的科技工作者,从而形成一个由 CSIG 男性、女性科技工作者共同组成充满活力的团体。 在 ICIG 2019 上举办的女性论坛聚焦图像和图形领域的前沿技术,以及领导力、职业生涯规划经验分享等。
会议注册网址
http://conf.csig.org.cn/fair/358
雷锋网 AI 科技评论 雷锋网