随着底层元器件、核心算法等基础技术的持续突破,3D视觉技术已迈入高速发展新阶段,其分辨率、精度、算力等关键性能指标实现跨越式提升。未来,该技术将加速向智能化、集成化、实时化、高性能及多场景应用方向演进,为工业数字化、消费电子智能化提供更高效、精准的感知支撑。在此背景下,中国光学工程学会联合上海交通大学、上海大学等优势单位,拟于2025年9月19-21日在苏州举办“第三届国际3D视觉感知与应用大会”。本次大会旨聚焦3D视觉感知技术的前沿突破、产业融合与生态构建。组委会诚挚邀请3D视觉领域的科研机构、高校及企业的专家和创新实践者共聚一堂,携手擘画3D视觉新未来。
大会名誉主席:
庄松林(上海理工大学,院士)
大会主席:
张广军(华中科技大学,院士)
谭久彬(哈尔滨工业大学,院士)
大会共主席:(音序)
曾小勤(上海交通大学)
张建华(上海大学)
赵慧洁(北京航空航天大学)
大会执行主席:(音序)
钱克矛(新加坡南洋理工大学)
陶卫(上海交通大学)
于瀛洁(上海大学)
组织委员会:
主席:(音序)
程鑫彬(同济大学)
戴博(上海理工大学)
李旭东(北京航空航天大学)
刘晓利(深圳大学)
苏榕(中国科学院上海光学精密机械研究所)
张宗华(河北工业大学)
左超(南京理工大学)
委员:(音序)
陈成(中国科学院上海光学精密机械研究所)
范晨夏(上海交通大学)
冯世杰(南京理工大学)
高楠(河北工业大学)
何文奇(深圳大学)
胡斌(北京理工大学)
姜宏志(北京航空航天大学)
毛逸飞(上海交通大学)
孟召宗(河北工业大学)
倪育博(河北工业大学)
唐雎(广东工业大学)
吴周杰(四川大学)
殷永凯(山东大学)
尹维(南京理工大学)
张亚萍(昆明理工大学)
周文静(上海大学)
会议议题:
专题一:3D成像与测量
本专题为“国际3D视觉感知与应用大会”与“国际计算成像会议”联合专题
结构光三维成像
条纹投影轮廓术
摄影测量技术
光度立体视觉
飞行时间(TOF)成像
激光雷达技术
数字图像相关DIC
散焦恢复形状法
相位测量偏折术
快速三维成像技术
集成成像
光场三维成像
基于深度学习的三维成像技术
三维成像传感技术与计算成像相关交叉领域
专题主席:
张启灿,四川大学
潘兵,北京航空航天大学
专题共主席:(音序)
邸江磊,广东工业大学
冯世杰,南京理工大学
高楠,河北工业大学
郭红卫,上海大学
李中伟,华中科技大学
苏榕,中国科学院上海光学精密机械研究所
杨佳苗,上海交通大学
专题程序委员(音序,待增补):
伏燕军,南昌航空大学
胡岩,南京理工大学
李勇,浙江师范大学
李轩,西安电子科技大学
刘凯,四川大学
刘超,北京航空航天大学
邵新星,东南大学
邵荣君,上海交通大学
王辰星,东南大学
王海霞,浙江工业大学
王发民,上海大学
吴周杰,四川大学
赵子越,中国航空工业集团公司北京长城计量测试技术研究所
专题秘书:
吴周杰,四川大学
唐雎,广东工业大学
专题二:3D视觉
三维传感
立体幻影
三维建模
三维视觉感知和边缘计算
三维数据语义分割与理解
3D数据处理、存储和传输
3D视觉相关的硬件、算法和技术
专题主席:
陶卫(上海交通大学)
专题共主席:
曹衍龙(浙江大学)
崔长彩(中国计量大学)
刘炳国(哈尔滨工业大学)
卢文龙(华中科技大学)
专题程序委员会(音序,待增补):
顾天奇(福州大学)
刘书钢(黑龙江大学)
刘秀实(中国科学院上海光学精密机械研究所)
路程(哈尔滨工业大学)
田庆国(天津大学)
吴军(中国民航大学)
王坤东(上海交通大学)
叶东(哈尔滨工业大学)
郑华东(上海大学)
专题秘书:
范晨夏(上海交通大学)
专题三:3D显示
数字全息术
裸眼3D显示
集成光场显示器
体3D显示
虚拟现实/增强现实/混合现实
与3D显示相关的硬件、算法和技术
专题主席:
刘娟(北京理工大学)
于瀛洁(上海大学)
专题共主席:
陈凤东(哈尔滨工业大学)
高洪跃(上海大学)
乔文(苏州大学)
桑新柱(北京邮电大学)
专题程序委员会:(音序,待增补):
常琛亮(上海理工大学)
焦述铭 (大湾区大学(筹))
陈超平(上海交通大学)
王梓(合肥工业大学)
夏新星(上海大学)
专题秘书:
胡斌(北京理工大学)
专题四:3D应用
智能制造
航空航天
医学
智慧城市与住房
历史文物和古代文物
无人驾驶
其他相关领域
专题主席:
张宗华(河北工业大学)
专题共主席:
李星辉(清华大学)
刘晓利(深圳大学)
宋丽梅(天津工业大学)
张祥朝(复旦大学)
专题程序委员会(音序,待增补):
姜宏志(北京航空航天大学)
林嘉睿(天津大学)
吕磊(河南工业大学)
南卓江(上海交通大学)
牛振歧(中国科学院上海光学精密机械研究所)
王健(华中科技大学)
王建华(青岛理工大学)
杨肖(西北工业大学)
殷永凯(山东大学)
张国锋(西安交通大学)
祝振敏(华东交通大学)
张韶辉(北京理工大学)
赵洪伟(中国飞机强度研究所)
专题秘书:
倪育博(河北工业大学)
特色专题:国际交流——智能感知与测量
三维智能传感
三维形貌测量
光学几何量测量
智能感知与计算成像
面向智能制造的光学传感
专题主席:
左超(南京理工大学)
专题共主席:
何文奇(深圳大学)
殷永凯(山东大学)
周文静(上海大学)
专题秘书:
尹维(南京理工大学)
青年专场(青年学者报告&优秀学生报告)
为进一步加强青年人才队伍建设,激发青年学者的科研热情,支持鼓励各层次青年学者的成长,本次大会由各专题共同组织,在会议期间举办青年学者报告专场/优秀学生报告专场,评出优秀报告授予证书,专场具体举办时间及安排将另行通知,欢迎广大青年学者积极投稿报名参与。参与方式:在会议投稿系统中投稿,投稿时专题选项中选择:青年专场。
以下内容为GPT视角对国际3D视觉感知与应用大会相关领域的研究解读,仅供参考:
国际3D视觉感知与应用研究现状
一、研究背景与意义
3D视觉感知技术是指通过特定的传感器和算法,使计算机能够像人类一样感知和理解三维空间中的物体形状、位置、姿态等信息。随着人工智能、机器人技术、自动驾驶、虚拟现实(VR)/增强现实(AR)等领域的快速发展,3D视觉感知技术成为关键支撑技术之一,对提升系统的智能化水平和用户体验具有重要意义。
二、主要研究进展
传感器技术
激光雷达(LiDAR):激光雷达以其高精度、长距离探测能力,在自动驾驶、地形测绘等领域得到广泛应用。近年来,固态激光雷达技术的突破,使得设备更加紧凑、成本更低,进一步推动了其商业化进程。
结构光相机:结构光相机通过投射特定的光模式到物体表面,利用相机捕捉变形后的光模式来重建三维形状。这项技术在人脸识别、手势识别等领域展现出巨大潜力。
飞行时间(ToF)相机:ToF相机通过测量光脉冲从发射到反射回来的时间来计算距离,适用于实时、高精度的三维重建,广泛应用于游戏、机器人导航等场景。
双目视觉与多目视觉:基于立体视觉原理,通过模拟人眼视角差异,利用算法计算物体在三维空间中的位置,成本较低,但对光照条件和计算能力有一定要求。
算法与模型
深度学习:深度学习在3D视觉感知中的应用极大地提高了点云处理、三维重建、目标检测与识别的精度和效率。例如,PointNet、PointNet++等网络结构直接处理点云数据,无需将其转换为体素或网格,有效保留了原始数据的几何信息。
SLAM(Simultaneous Localization and Mapping):即时定位与地图构建技术,结合3D视觉感知,使机器人或自动驾驶车辆能够在未知环境中同时进行自我定位和环境建模,是实现自主导航的关键技术。
三维重建算法:从多视角图像或深度图中恢复三维模型的技术不断进步,包括基于体素、基于网格、基于隐式函数等多种方法,满足了不同应用场景的需求。
应用领域拓展
自动驾驶:3D视觉感知技术是实现自动驾驶车辆环境感知的核心,包括障碍物检测、道路识别、行人检测等,直接关系到行车安全。
机器人技术:在工业自动化、服务机器人等领域,3D视觉感知帮助机器人实现精准抓取、避障、导航等功能,提高了工作效率和灵活性。
医疗健康:3D视觉感知在手术导航、康复训练、远程医疗等方面展现出应用价值,如通过三维重建技术辅助医生进行复杂手术规划。
娱乐与教育:VR/AR技术中,3D视觉感知为用户提供了沉浸式的交互体验,如虚拟旅游、在线教育中的三维模型展示等。
三、面临的挑战
数据获取与处理:高质量的三维数据获取成本高,且处理复杂度高,需要高效的算法和强大的计算资源。
环境适应性:不同光照条件、动态场景下的鲁棒性仍是挑战,尤其是在户外复杂环境中。
隐私与安全:随着3D视觉感知技术在个人设备上的应用,如何保护用户隐私和数据安全成为重要议题。
标准化与互操作性:缺乏统一的标准和协议,不同厂商的设备与系统间互操作性差,限制了技术的广泛应用。
四、未来发展趋势
传感器融合:结合多种传感器技术,如激光雷达、摄像头、IMU等,通过多源信息融合,提高3D视觉感知的准确性和鲁棒性。
边缘计算与AI芯片:随着边缘计算技术的发展,将3D视觉感知算法部署到边缘设备上,减少数据传输延迟,提高实时性。同时,定制化的AI芯片将进一步提升处理效率。
低成本与小型化:推动传感器和计算平台的低成本、小型化,使得3D视觉感知技术能够更广泛地应用于消费级产品。
跨学科融合:与材料科学、生物医学、心理学等领域的交叉融合,将激发新的研究热点和应用场景,如仿生视觉系统、情感计算等。
国际3D视觉感知与应用研究可以应用在哪些行业或产业领域
1.自动驾驶与智能交通
环境感知:3D视觉感知技术用于自动驾驶车辆的环境感知,包括障碍物检测、道路识别、交通标志识别、行人检测等,帮助车辆实现安全、高效的自主导航。
高精度地图构建:结合SLAM技术,3D视觉感知可实现高精度地图的实时构建与更新,为自动驾驶提供准确的地理信息支持。
2.机器人技术
工业自动化:在工业生产线上,3D视觉感知技术用于机器人的精准抓取、装配、检测等任务,提高生产效率和产品质量。
服务机器人:在医疗、物流、家庭服务等领域,3D视觉感知使机器人能够识别环境、避障、导航,并执行复杂的任务,如手术辅助、货物搬运、家庭清洁等。
3.医疗健康
手术导航:3D视觉感知技术用于手术导航系统,通过三维重建患者的解剖结构,辅助医生进行精确的手术操作,提高手术成功率和患者安全性。
康复训练:在康复医学中,3D视觉感知技术可用于评估患者的运动功能,提供个性化的康复训练方案,并实时监测训练效果。
远程医疗:结合VR/AR技术,3D视觉感知为远程医疗提供沉浸式的交互体验,如远程会诊、手术示教等。
4.娱乐与媒体
虚拟现实(VR)/增强现实(AR):3D视觉感知技术是VR/AR的核心技术之一,用于创建逼真的虚拟环境或增强现实场景,为用户提供沉浸式的娱乐体验。
游戏开发:在游戏开发中,3D视觉感知技术用于实现更真实的角色动作、环境交互和物理模拟,提升游戏的趣味性和互动性。
影视制作:在影视制作中,3D视觉感知技术用于三维建模、场景重建和特效制作,提高影视作品的视觉效果。
5.安防与监控
人脸识别与行为分析:3D视觉感知技术用于人脸识别系统,提高识别的准确性和鲁棒性。同时,结合行为分析算法,可实现对异常行为的实时监测和预警。
三维重建与场景分析:在安防监控中,3D视觉感知技术可用于三维重建监控场景,提供更全面的视角和信息,帮助安保人员更好地理解和应对突发情况。
6.航空航天与国防
无人机导航:3D视觉感知技术用于无人机的自主导航和避障,提高无人机的飞行安全性和任务执行效率。
地形测绘与目标识别:在航空航天领域,3D视觉感知技术用于地形测绘、目标识别和跟踪等任务,为军事决策提供重要支持。
7.智慧城市与物联网
城市规划与管理:3D视觉感知技术用于城市的三维建模和规划,帮助城市管理者更好地理解和规划城市空间。
智能家居:在智能家居领域,3D视觉感知技术用于实现更智能的人机交互和环境感知,如手势控制、人体姿态识别等。
8.零售与电商
虚拟试衣与商品展示:在零售和电商领域,3D视觉感知技术用于实现虚拟试衣、商品三维展示等功能,提升消费者的购物体验。
库存管理与物流优化:通过3D视觉感知技术,可实现库存商品的精准识别和定位,优化物流流程,提高仓储和配送效率。
国际3D视觉感知与应用领域有哪些知名研究机构或企业品牌
国际3D视觉感知与应用领域的知名研究机构与企业品牌一、知名研究机构
麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)
研究方向:3D视觉感知、计算机视觉、机器人技术。
贡献:在SLAM技术、三维重建算法等领域取得突破性成果,推动自动驾驶与机器人导航技术的发展。
斯坦福大学人工智能实验室(SAIL)
研究方向:深度学习、3D视觉感知、医疗影像分析。
贡献:通过深度学习算法优化3D数据处理的效率与精度,在医疗领域实现三维重建辅助手术规划。
苏黎世联邦理工学院(ETH Zurich)计算机视觉实验室
研究方向:实时3D感知、动态场景建模。
贡献:开发高精度动态环境建模算法,为自动驾驶与工业机器人提供实时环境感知能力。
德国马克斯·普朗克智能系统研究所(MPI-IS)
研究方向:仿生视觉、3D感知与机器人交互。
贡献:结合仿生学原理设计3D视觉系统,提升机器人对复杂环境的适应能力。
卡内基梅隆大学机器人研究所(RI)
研究方向:多传感器融合3D感知、人机协作。
贡献:通过激光雷达与摄像头融合技术,实现复杂工业场景下的精准定位与导航。
二、企业品牌
Intel RealSense
核心产品:深度摄像头模块(如D400系列)。
应用领域:机器人导航、AR/VR交互、3D扫描。
优势:提供低功耗、高精度的实时3D感知解决方案,支持跨平台开发。
Apple
核心技术:LiDAR扫描仪(iPhone/iPad Pro系列)。
应用领域:增强现实(AR)、摄影测量、室内导航。
优势:将3D感知技术集成至消费级设备,推动AR应用普及。
Microsoft HoloLens
核心产品:混合现实头显(搭载深度传感器)。
应用领域:工业设计、远程协作、教育。
优势:通过3D视觉感知实现虚拟与现实的无缝融合,提升交互体验。
NVIDIA
核心技术:Omniverse平台(基于3D视觉的仿真引擎)。
应用领域:自动驾驶仿真、数字孪生、影视制作。
优势:提供高性能计算与实时渲染能力,支持大规模3D场景建模。
Occipital(结构光技术代表)
核心产品:Structure Sensor(便携式3D扫描仪)。
应用领域:室内测绘、3D建模、游戏开发。
优势:通过结构光技术实现高精度、低成本的3D数据采集。
Velodyne Lidar(激光雷达领军者)
核心产品:VLP-16、Alpha Prime等激光雷达传感器。
应用领域:自动驾驶、智慧城市、测绘。
优势:提供长距离、高分辨率的3D点云数据,满足复杂环境感知需求。
SICK(工业3D视觉专家)
核心产品:3D激光扫描仪、立体视觉系统。
应用领域:物流分拣、质量检测、机器人引导。
优势:针对工业场景优化,具备高稳定性与抗干扰能力。
Zivid(高精度3D相机)
核心产品:Zivid One+系列3D彩色相机。
应用领域:精密装配、缺陷检测、人机协作。
优势:提供亚毫米级精度的3D成像,支持复杂材质表面识别。
三、行业应用与品牌匹配
自动驾驶:Velodyne Lidar(激光雷达)、NVIDIA(仿真平台)
机器人技术:Intel RealSense(深度感知)、SICK(工业视觉)
医疗健康:Apple(AR辅助手术)、Zivid(精密检测)
娱乐与媒体:Microsoft HoloLens(混合现实)、Occipital(3D建模)
国际3D视觉感知与应用领域有哪些招聘岗位或就业机会
一、技术研发类岗位1. 计算机视觉算法工程师
职责:
开发3D点云处理、三维重建、目标检测与跟踪算法
优化深度学习模型(如PointNet、3D卷积网络)在3D数据上的性能
参与SLAM(即时定位与地图构建)系统的研发
技能要求:
精通C++/Python,熟悉PCL(点云库)、Open3D等工具
掌握PyTorch/TensorFlow框架,熟悉3D数据预处理与模型训练
有激光雷达、RGB-D相机等传感器数据处理经验者优先
就业方向:
自动驾驶公司(如Waymo、Cruise)
机器人企业(如波士顿动力、优必选)
科技巨头(如NVIDIA、Apple)的AI实验室
2. 传感器工程师
职责:
设计并优化3D视觉传感器(激光雷达、ToF相机、结构光模块)
解决多传感器融合中的时序同步与标定问题
参与硬件选型与系统集成测试
技能要求:
熟悉光学原理、电子电路设计
掌握MATLAB/Simulink仿真,了解ROS(机器人操作系统)
有FPGA/嵌入式开发经验者优先
就业方向:
传感器制造商(如Velodyne、Luminar)
消费电子企业(如华为、三星)的硬件研发部门
3. 深度学习研究员
职责:
研究3D视觉领域的前沿模型(如NeRF、隐式神经表示)
探索自监督学习、小样本学习在3D数据上的应用
发表顶会论文(CVPR、ICCV、ECCV)推动技术落地
技能要求:
精通PyTorch/TensorFlow,熟悉3D数据增强与评估指标
有Transformer、图神经网络等模型优化经验
具备科研论文撰写与项目申报能力
就业方向:
学术机构(如MIT CSAIL、斯坦福SAIL)
工业界研究院(如微软亚研院、谷歌DeepMind)
二、产品与应用类岗位1. 3D视觉解决方案架构师
职责:
针对客户需求设计3D视觉系统(如工厂自动化分拣方案)
协调算法、硬件、软件团队完成项目交付
优化系统成本与性能平衡
技能要求:
熟悉3D视觉技术栈(传感器、算法、部署)
具备工业自动化、物流仓储等行业经验
掌握项目管理工具(如Jira、Confluence)
就业方向:
系统集成商(如西门子、ABB)
初创公司(如奥比中光、速腾聚创)的售前技术支持
2. 产品经理(3D视觉方向)
职责:
定义3D视觉产品的功能与市场定位(如AR眼镜的交互设计)
跟踪行业趋势,推动技术商业化
与研发、市场团队协作完成产品迭代
技能要求:
了解3D视觉技术边界与用户需求
具备数据分析能力(如用户行为分析、竞品对比)
有硬件或软件产品管理经验优先
就业方向:
消费电子企业(如Apple、Meta)
工业软件公司(如PTC、达索系统)
3. 3D视觉测试工程师
职责:
设计3D视觉系统的测试用例(如点云精度、目标识别准确率)
搭建自动化测试平台,定位算法与硬件缺陷
编写测试报告并推动问题修复
技能要求:
熟悉3D数据格式(如PCD、PLY)与可视化工具(如CloudCompare)
掌握Python自动化测试框架(如Pytest)
了解CI/CD流程
就业方向:
自动驾驶企业(如小鹏汽车、特斯拉)
机器人公司(如科沃斯、极智嘉)
三、行业交叉类岗位1. 医疗3D视觉工程师
职责:
开发手术导航系统的3D视觉模块(如器官三维重建)
优化医学影像(CT、MRI)与实时3D数据的配准算法
参与临床测试与医疗器械认证
技能要求:
熟悉DICOM医学影像标准
掌握ITK、SimpleITK等医学图像处理库
了解FDA/CE医疗器械法规
就业方向:
医疗设备公司(如西门子医疗、直觉外科)
科研机构(如约翰霍普金斯大学医学院)
2. 虚拟制片技术专家
职责:
使用3D视觉技术实现影视拍摄中的虚拟场景合成
开发动作捕捉与面部表情识别的实时渲染方案
优化LED虚拟拍摄系统的光场匹配算法
技能要求:
精通Unreal Engine/Unity的3D视觉插件
了解电影制作流程与虚拟制片技术(如《曼达洛人》拍摄)
具备跨团队协作能力(导演、摄影师、工程师)
就业方向:
影视制作公司(如工业光魔、迪士尼)
游戏引擎企业(如Epic Games)
3. 智慧城市3D建模工程师
职责:
通过无人机/车载激光雷达构建城市三维模型
开发BIM(建筑信息模型)与GIS(地理信息系统)的融合方案
优化大规模3D点云的存储与渲染效率
技能要求:
熟悉Cesium、ArcGIS等地理空间工具
掌握WebGL、Three.js等Web端3D可视化技术
了解城市规划与数字孪生标准
就业方向:
智慧城市解决方案提供商(如海康威视、大疆)
政府规划部门与科研机构
四、职业发展路径与薪资水平1. 技术路线
初级工程师(年薪15-30万美元):
负责算法实现、传感器调试等基础工作。
高级工程师/技术专家(年薪30-60万美元):
主导核心模块开发,解决复杂技术问题。
首席科学家/CTO(年薪60万美元+):
制定技术战略,推动前沿研究落地。
2. 管理路线
技术经理(年薪25-50万美元):
管理5-10人团队,协调跨部门资源。
产品总监/事业部负责人(年薪50-100万美元+):
负责产品全生命周期管理,制定市场策略。
3. 薪资影响因素
地域:美国(硅谷、波士顿)薪资最高,中国(深圳、上海)次之。
企业类型:初创公司股票期权激励强,大厂福利稳定。
技能稀缺性:掌握NeRF、4D重建等前沿技术者薪资溢价明显。
五、如何进入该领域?
技术储备:
掌握C++/Python、深度学习框架、3D数据处理工具。
参与Kaggle 3D视觉竞赛或开源项目(如OpenMMLab)。
项目经验:
完成3D目标检测、SLAM等领域的个人项目。
争取在自动驾驶、机器人公司实习。
行业人脉:
参加CVPR、ICRA等顶会,加入LinkedIn技术社群。
关注3D视觉领域大牛(如Andreas Geiger、Raquel Urtasun)的动态。