各位选手,经过对B榜当前提交选手的实名认证排查、小号排查、A榜有效提交审核,我们确定榜单中18支队伍(其中排名18、19、21的三个选手因未实名视为失去资格)需要提交复核材料,进一步由命题方复核其解决方案的有效性,并确定最终进入答辩的10支队伍。
我们已邮件了18支队伍相关下一步操作的资讯,请各位注意查收邮件。
0522 公告
1. 数据集下载链接中已新增了google drive的链接
2. 周末已有同学申请了模型对齐,刚刚命题方已全部返还,大家可以期待分数上线排行榜了。但请注意拿到手的对齐模型文件,请自行再根据线上提交要求做下正确的压缩封装,不要直接提交拿到的压缩包,可能无法正常评分。
3. 请大家注意,测试集中“六神”这个物品,请按照最新的测试集命名方式命名产出物 liusheng.obj ,这样保持一致能够确保正确评分。
0520 公告
*** 关于数据集的修正 ***
目前已更新了数据,可在数据获取中下载新的downloadlink,访问新的网盘地址(为便于直接下载修正文件,文件未压缩)
具体修正说明:
所有模型,中心点都放在了(0,0,0)
训练集包、水壶吊牌去掉了,包的视频也做了更新
A榜blackbag做了修改,视频也做了更新
***关于提交流程暂时修改的说明****:
1. 背景:当前注意到选手所生成的模型因中心点移位、大小放缩、方向旋转等因素,会导致评分程序无法正常评分。虽已在昨日公告了标准规范中心点等设置,但似乎仍无法完全解决问题。目前命题方正研究新的自动评分流程,暂时过渡期间通过以下方式实现评分。
2. 过渡方案:由命题方为选手生成的obj文件做手动调整后,邮件返回选手调整后的obj,选手线上再提交获取打分
3. 修改后的提交流程:
a) 选手完成模型输出准备线上评分前,请先将obj文件统一压缩入zip后,提交至指定的文件归集点
https://send2me.cn/xVwdVDQ1/RISr5S4ffz304w
b) 命题方统一处理选手的obj,做手动调整,调整后的obj将返还给选手。
c) obj统一每日收集后,次日由命题方统一批量处理返还。原则上在24小时内应当可以获取调整后的obj
d)选手获取调整后的obj后,请自行在平台上提交,并获取分数。
0518公告
1、坐标问题
请确保输出的obj中,把物体的中心放到(0,0,0)上,物体的中心是X/2,Y/2,Z/2
2、朝向问题
物品以视频拍摄为参考,朝上(Y轴正方向)放置到(0,0,0)
3、物体尺度
命题方会预期在明天给选手物品obj文件里物品的参考尺寸以及顶点数
4、物品视频和obj不一致问题
命题方预期明天会把训练集中的bag,dianshuihu做内容更新以解决目前物品内容有不一致的地方
0512公告
目前A榜已正式开放!目前A榜已正式开放!目前A榜已正式开放!
请大家注意11号前下载的训练集需做修正,修正补丁请见0511公告。11号起下载的数据无问题。测试集情况见11号公告。
0511公告
1. 关于11号前所下载训练集的修正补丁
请大家注意,如在11号前下载了训练集的,请务必下载这个额外的补丁:
https://pan.baidu.com/s/1CMb66K7xJAe3FFkpU2aIPA?pwd=8f9t
补丁用于修正训练集中obj文件(原先mesh为四边形,现在修正为更通用的三边形)
11号起,线上提供的下载链接txt文件内包含的链接已指向更新的数据
2. A榜测试集发布
A榜测试集已发布,目前已包含在下载链接txt中。
或可通过下述链接直接下载:https://pan.baidu.com/s/1yh8ctG6NgJdtusVjx_hFEQ?pwd=5r9f
|
说明 |
训练集 |
训练集:7个物品 每个物品提供视频文件、网格模型、点云模型
|
测试集 |
A榜:3个物品 B榜:3个物品 测试集仅提供视频文件 |
开发与模型输出 |
A榜和B榜最终输出要求输出物品网格模型,格式为obj
终评时需附加输出纹理贴图,贴图格式为png
所有训练和推理过程均在线下完成,线上仅提交结果文件 |
关键节点 |
本竞赛采用AB榜模式开展: A榜开启:5月12日(周五)(拟) A榜截止:6月2日(周五)24:00 (请完成实名认证,A榜成绩方生效) B榜开启:5月29日(周一)00:00 B榜截止:6月2日(周五)24:00 (必须在A榜有成绩,B榜成绩方生效) 解决方案PPT提交截止:6月10日24:00 (B榜前20需提交,一切时间点和要求以邮件为准) |
提交限制 |
A榜每日最多5次提交; B榜每日最多1次提交 |
奖励 |
依据: 赛事将以B榜分数为准计算技术得分,并综合解决方案的原创性和创意性,最终选拔10名晋级决赛答辩。决赛答辩将通过现场评审得分结合主观评审得分做综合考量。
奖励: 1.12万元奖金池 2.SMT实习绿色直通车 3.AIWIN证书 |
SMG技术中心(上海东方传媒技术有限公司)、OPG云计算中心(研究院)、上海东方希杰商务有限公司(东方购物)
随着虚拟现实、增强现实、元宇宙等技术的发展,数字孪生广泛应用于各行业。在文化媒体行业,数字孪生主要应用于制作虚实结合的节目,比如:沉浸式新闻、虚拟数字人选秀、虚拟体育赛事等等,在这些节目中,需要逼真的、生动的呈现虚拟的人物、道具、场景等,来实现导演的内容创意,并为观众营造视觉体验的真实感和互动感。
其中,三维建模是数字孪生技术的重要组成部分。传统三维重建方法一般是通过maya等三维制作软件手工建模或通过光学设备扫描建模。不仅专业性强,且成本高、周期长,无法满足大规模快速建模的需求。
相比传统三维重建的方法,基于深度学习在三维重建算法具有强大的特征提取能力、自适应学习能力、数据驱动的方法、可扩展性和端到端的处理方式等优势,能够更好地处理复杂的三维重建任务,实现降本增效。
本次大赛以数字孪生中的物品三维重建作为主题,鼓励选手利用深度学习的方法,构建物体的三维重建模型,力求生成更高质量、更逼真的物体三维模型,并能使用在媒体的内容制作中。
三维重建是指将二维图像或视频序列转换为三维场景模型的过程。三维重建技术在数字化和虚拟化方面具有广泛的应用前景。例如,博物馆可以使用三维重建技术将珍贵的文物和藏品数字化,使之能够以高质量的方式共享和展示。在网络购物中,三维重建技术可以帮助消费者更加直观地了解产品的外观和质量,提高购物的满意度。在虚拟人制作方面,三维重建技术可以更加准确地捕捉人体的细节和形态,为游戏、电影和其他虚拟现实应用提供更加真实的场景。此外,三维重建在智能家居、机器人导航、无人驾驶等领域也有很大的应用潜力。
从技术角度来说,三维重建可以分为以下几类:
基于激光扫描的三维重建:这种方法使用激光扫描仪等设备对物体表面进行扫描,获取其表面形态和结构信息,并根据扫描数据还原三维模型。
基于结构光的三维重建:这种方法使用投影结构光或闪光摄影等技术,将光线投射到物体表面,利用其变形信息计算出物体表面的三维形态。
基于多视角的三维重建:这种方法使用多个摄像机从不同角度捕捉物体的图像,并根据这些图像计算出物体的三维模型。
基于深度学习的三维重建:这种方法使用深度学习技术,从大量的二维图像中学习三维场景的表示和特征,从而还原出三维模型。
尽管三维重建技术在多个领域中都有广泛的应用,但它仍然存在一些缺陷和局限性,如基于激光扫描的三维重建需要昂贵的设备;无法处理动态物体;需要一定的时间进行扫描和处理。基于结构光的三维重建受到光线干扰,可能会导致重建结果不准确;无法处理动态物体。基于多视角的三维重建需要大量的图像匹配和处理,计算复杂度较高;需要多个摄像头进行拍摄,设备成本较高。基于深度学习的三维重建需要大量的训练数据;重建精度受到数据质量和模型训练的影响;无法处理新颖的物体类型。
相比于其他三维重建技术,基于深度学习在三维重建方面具有强大的特征提取能力、自适应学习能力、数据驱动的方法、可扩展性和端到端的处理方式等优势,能够更好地处理复杂的三维重建任务,提高重建精度和效率。
为了进一步推广和应用三维重建,我们将举办一个以三维重建为主题的人工智能大赛。我们鼓励参赛选手利用深度学习的方法生成更高质量、更逼真的三维场景,并探索该技术在各个领域的应用。
本次比赛将为选手提供用于三维重建训练的数据集,数据集包含多个物体的视频、网格模型、点云模型。选手基于该数据集训练AI模型,输出三维重建结果。
视频数据由选手自行抽帧和预处理,预处理可以包括但不限于图像增强、语义分割、相机参数估计等。
神经网络输入可以是Multi-view Images(参考MVS) 或 3D point coordinates(x, y, z) 和 viewing direction(θ,Φ)(参考NeRF),神经网络原始输出可以是点云模型或网格模型和纹理贴图(可选)。
A榜和B榜最终输出要求输出物品网格模型,格式为obj,该三维模型由神经网络输出的点云模型或网格模型生成,允许基于开源框架对点云、网格进行优化后输出obj模型。
终评要求(可选)输出纹理贴图,贴图格式为png,纹理贴图可以和三维重建共用神经网络或者使用开源框架生成。
开源框架要求满足MIT/Apache/BSD协议,并以源码的形式集成到工程;不可使用开源软件和商业软件手工优化模型、手工生成纹理贴图。
神经网络输入:
Multi-view Images or 3D point coordinates(x, y, z) and viewing direction(θ,Φ)
神经网格输出:
3D Point Cloud or Mesh and texture (optional)
最终输出:
Mesh and texture (optional)
四、赛题数据
数据采集方式
数据集内容和规模
A榜 |
B榜 |
训练集:7个物品 每个物品提供视频文件、网格模型、点云模型 测试集:3个物品 测试集仅提供视频文件 |
训练集:不额外提供 测试集:3个物品 测试集仅提供视频文件 |
本赛题共分成三个大阶段:
线上比赛(A、B 榜)——成绩复核——终选答辩
线上比赛阶段采用 A、B 榜模式,并在 PPT 和代码核验后挑选前 10 名进入终选答辩。
该阶段内接受个人报名、团队登记(报名登记规则请详细阅读比赛规则)。
参与的选手,需与SMG技术中心(SMT)签署相关的参赛协议,以规范数据使用范围和履行保密义务。其中「非正式代表企业机构」参赛的,在报名时勾选同意比赛规则即视为「个人」已电子签署参赛协议,无需进一步操作。若赛事队伍(无论几人组成)需「正式代表企业机构」参赛(即希望最终获奖时,奖项归属至实体机构,并以实体机构名称对外宣发),则请下载此保密协议文档,并按此文档首页的说明操作。
(1)训练集:线上比赛将为选手7个物品的视频、网格模型、点云模型。
(2)测试集:选手完成模型训练后,可基于3个物品的测试集生成点云模型,上传到评分平台获取排名。A榜和B榜将分别提供两个不同版本的测试集。
(3)数据下载:选手可通过 AIWIN 平台「参赛提交」——「下载」 的路径,查看并下载数据集。
(4)解压密钥:选手下载数据后需完成实名认证,并签署保密协议,方能获得数据密钥,解密数据。
(5)成绩有效:B榜成绩有效的前提是有有效的 A 榜成绩;A 榜成绩有效额前提是完成实名认证和协议签署。
(6)实名认证:请注意本次竞赛要求所有选手完成实名认证方能核算成绩,请未做过实名认证的点击页面右上角进入个人中心,点击“完成实名认证”。实名认证采用三要素:姓名、手机号和身份证,请确保手机号为您本人名下实名认证的号码。
(1) 本题目的提交内容应是测试集物品所对应产出的object_name.obj 。object_name 请根据提供的测试集物品视频名称对应命名。例如 bao.mp4 应对应命名为 bao.obj。 错误命名将导致评判程序判分为0。
(2) 所有的object_name.obj 应整体打包压缩为一个ZIP文件,并确保该压缩包解压后,所有文件在根目录下直接可访问而非嵌套有其他复杂的文件夹结构。压缩包结构错误,将导致系统无法获取任何文件,而判分为0。
(3) 压缩包请统一命名为 用户 ID_YYMMDD.zip,用户 ID 为你注册时的用户名(如为个人)或团队名(如为团队)。
A榜每日最多5次提交。B榜每日最多1次提交。
请注意,为避免不可预见的问题,团队中请保持使用统一账号负责提交。具体保留在排行榜上的成绩按照 D 小节「排名规则」的设定。
排行榜以选手历史最佳分数为依据从高到低排序。
排行榜截止排名后,工作人员将对排行榜做复核,确认所有榜上个人和团队都已完成实名认证,并剔除相关小号记录等。
(1) 线上比赛结束后,AIWIN 将尽快(一般为1-2个工作日)内确定 B 榜有效的前 20 名(即队伍所有人完成实名认证、有有效A榜成绩,且未有队伍重复、小号等问题),通知提交 PPT 和代码。
(2) 为便于选手准备,请 B 榜成绩进入前 30 的提前准备 PPT 和代码。我们正式通知提交后,一般应在2天内提交完毕。
(3) PPT和代码应通过邮件通知的方式予以准备和提交。代码如体量较大,可提供网盘下载链接。
(4) 解题思路 PPT 命名应为「选手名.ppt」,对于个人参赛选手名即个人 ID,团队参赛选手名即为团队名
(5) PPT 可参照如下结构准备:
个人简介:在职者填写当前职业和在职机构(如方便透露),在校者请填写当前年级、专业、高校团队简介:团队整体介绍,以及每个成员的介绍、成员分工
赛题理解与问题建模:清楚描述对赛题任务的理解,抽象为模型建立的策略
数据探索与特征工程:针对赛题提供的数据描述必要的数据特征、数据清洗、特征工程的关键思路和方法
模型训练和融合:描述模型的训练、实验对比和融合过程与方法
代码依赖环境:详细列出包括整体建模采用的基础框架(含版本号)以及依赖的包等
代码说明:代码请整理后,请提供 README 文档,对代码的运行方式,代码结构、代码依赖等做相关说明。若采用第三方库或代码等,请列明相应情况,并说明相应的开源授权许可证情况
评价方式分为客观评价和主观评价。A榜和B榜线上排名采用客观评价方式,评价指标为F1-Score:
F1-Score 是精确度和召回率的加权平均值,其中精确度表示模型正确预测为正的样本数与总预测为正的样本数的比例,而召回率则表示模型正确预测为正的样本数与总实际为正的样本数的比例。
对于三维重建,F1-Score 可以用于评估模型生成的三维重建网格与真实三维形状之间的相似程度,包括完整性和精度。
F1-Score 的值越高,表示模型生成的三维网格越接近真实形状,模型性能越好。
三维重建的主观评价是指根据人的主观感受和经验对三维重建结果进行评价的方法,通常采用用户调查或专家评估的方式。主观评价可以评估三维重建的质量和可视化效果,对于提高三维重建算法的精度和稳定性具有重要意义。
主观评价通常包括以下几个方面:
几何形状:评估重建结果的几何形状是否符合实际物体的形状,是否存在缺陷和伪影等问题。
表面细节:评估重建结果的表面细节是否光滑,是否有尖锐的边缘和锯齿状的形态。
类型 |
奖项 |
名次 |
奖励(税前) |
竞赛奖励 (依据综合排名 = B 榜排名 + 复审结果 + 终选答辩排名) |
一等奖 |
第1名 |
60000 元 |
二等奖 |
第2名 |
20000 元 |
|
三等奖 |
第 3 名 |
10000 元 |
|
四等奖 |
第 4-6 名 |
6000 元 |
|
五等奖 |
第 7-10 名 |
3000 元 |
注:
所有获奖选手(含学习奖励奖项与竞赛奖励奖项)将颁发盖有“世界人工智能创新大赛组委会”的赛事证书,对应赛题的证书上将同时印刻有赛事命题方的官方 logo
对于赛事排名靠前的选手将给予实习生绿色直通车的机会,将在实习招聘过程中给予一定优惠(如免笔试等,具体待进一步确定)
评价方式分为客观评价和主观评价。A榜和B榜线上排名采用客观评价方式,评价指标为F1-Score:
F1-Score 是精确度和召回率的加权平均值,其中精确度表示模型正确预测为正的样本数与总预测为正的样本数的比例,而召回率则表示模型正确预测为正的样本数与总实际为正的样本数的比例。
对于三维重建,F1-Score 可以用于评估模型生成的三维重建网格与真实三维形状之间的相似程度,包括完整性和精度。
F1-Score 的值越高,表示模型生成的三维网格越接近真实形状,模型性能越好。
三维重建的主观评价是指根据人的主观感受和经验对三维重建结果进行评价的方法,通常采用用户调查或专家评估的方式。主观评价可以评估三维重建的质量和可视化效果,对于提高三维重建算法的精度和稳定性具有重要意义。
主观评价通常包括以下几个方面:
几何形状:评估重建结果的几何形状是否符合实际物体的形状,是否存在缺陷和伪影等问题。
表面细节:评估重建结果的表面细节是否光滑,是否有尖锐的边缘和锯齿状的形态。
请注意,2022 赛季起实名认证都将作为晋级或切榜后成绩有效的前提。
实名认证需通过点击系统右上角用户名处,进入「设定」界面操作。
在此界面请先确认姓名是否为真实姓名,若不是请修改,并点击页面最下方的保存按钮。之后点击「前往实名认证」
在实名认证页面,你需要填入自己的身份证号和手机号(请使用登记在你身份证名下的手机号)
若三者信息匹配即可完成实名认证。
如果你的手机未实名认证在你个人名下,或,你信息都正确却始终无法成功实名认证
请将以下信息完整发送至 it@aispacesh.com:
你的用户名
你的姓名
你的身份证号码
你的身份证正面照片或扫描件
邮件标题可写为:「实名认证申请人工审核」
Start: 五月 8, 2023, 11 a.m.
概述: A榜开放,直至6月2日;需队伍所有人实名认证,成绩方生效
Start: 五月 29, 2023, 午夜
概述: B榜开放(A榜仍开放),直至6月2日
Start: 六月 3, 2023, 午夜
概述: 公布前 10 晋级者,开展终选答辩
七月 31, 2023, 8 a.m.
请登陆来参加比赛
登入# | 用户名 | 分数 |
---|---|---|
1 | naiyue233 | 0.889 |
2 | ReaLX | 0.873 |
3 | cat_on_the_kite | 0.871 |