1. 请注意因故障,5月 17 日1800前 B 榜的分数有异常,我们已修复,但影响到了目前已提交人员的提交次数。如下列选手之后缺少一次提交,可联络我们 it@aispacesh.com,我们可为你增补一次提交,相关ID 如下:
1 |
yp |
3 |
05/17/22 |
|
2 |
wjn1996 |
3 |
05/17/22 |
antins |
3 |
guo_chengfeng |
2 |
05/17/22 |
小样本 |
4 |
luxuantao |
2 |
05/17/22 |
知识工场 |
5 |
Monica_1999 |
2 |
05/17/22 |
消失的第四人 |
6 |
x15010470528 |
2 |
05/17/22 |
|
7 |
simonzsn |
2 |
05/17/22 |
zsn&DT |
8 |
xiyy |
2 |
05/17/22 |
fight |
9 |
An_Shan |
2 |
05/17/22 |
2.请参赛选手们注意,5 月 17 日开始我们正式开启 B 榜,请注意当前 A、B 榜同时处于提交状态,规则如下:
a. A 榜将和B 榜同样在 5 月 27 日结束, 每日仍旧保持 3 次提交的限制
b. B 榜测试集已目前上架下载页面,请大家下载使用,并请注意 B 榜设定为全流程中总共 10 次的提交限制
c. 选手仍旧需要有有效的 A 榜成绩(需完成实名认证),方能使 B 榜成绩有效
d. 最终我们还是选 20 名要求提交解决方案文档和模型代码等进入复核,并从中挑选 10 名进入终选答辩
e. 上述 20 名的选拔,以有效的 B 榜成绩为准
3. 当前大家提交时,务必注意,默认系统已经进入B 榜,所以要提交 A 榜的话,需在提交页面手动点击 A 榜切换。具体见下图示意:
4. 请注意,太保对赛题有以下两点要求:
A.“本次赛题目标为探索统一范式的多任务小样本学习,比赛提交结果的模型建议为可独立完成所有任务的单一模型,总模型大小限制在1.5G。"
B. 本次赛题不支持采用伪标签方式,无论是人工伪标签还是模型生成伪标签,均不得用于本赛题的解决方案,一经复核发现将直接取消相应分数。|
AIWIN2022春季赛季技术挑战赛之一,由中国太平洋保险命题,提供来自一线真实业务的多任务小样本学习自然语言理解数据集,设立奖金池及提供太保实习生绿色通道奖励。该竞赛过程配套学习内容涵盖基线程序、基线讲解、技术讲座等。该竞赛分数可作为 AI 人才特训营学习考核参照,达到基线分数以上即可有资格竞争暑期实训机会。
|
任务介绍 |
训练集 |
280条自然语言理解任务相关数据,覆盖保险、金融、医疗三大领域,包含文本分类、文本相似度、自然语言推断、命名实体识别、及机器阅读理解等五大任务,具体包含14个任务,每个任务20条数据 |
测试集 |
5600条自然语言理解任务数据,具体包含14个任务,每个任务包含400条数据,分A/B榜各200条(2800+2800) 请在「参赛提交」-「下载」获取 A、B 榜各自的数据(A榜含训练数据+测试任务,B 榜仅测试任务) |
开发与模型输出 |
可线下开发和模型输出,AIWIN 平台提交结果 |
关键节点(拟) |
本竞赛采用 AB 榜模式开展: A 榜开启:4月18日 A 榜截止:5月16日24:00 (需完成实名认证,A 榜成绩方生效) B 榜开启:5月17日00:00 (必须在A榜有成绩,B 榜成绩方生效) B 榜截止:5月27日24:00 解决方案 PPT 提交截止:5 月 29 日 24:00 |
提交限制 |
A榜每日最多3次提交; B榜全程最多10次提交 |
奖励 |
依据: 赛事将以 B 榜分数为准计算技术得分,并综合解决方案的原创性和创意性,最终选拔 10 名晋级决赛答辩。决赛答辩将通过现场评审得分结合技术得分做综合考量。
奖励:
|
中国太平洋保险集团有限责任公司
受益于大规模训练数据集,目前预训练语言模型在很多开源自然语言理解榜单上取得了接近甚至超过人类水平的性能。然而在真实保险业务场景中难以积累大规模高质量标注数据,一些在开源数据集上表现优秀的方案无法体现其先进性,且真实业务任务之间的差异性难以保证模型的迁移复用能力。针对上述问题,统一范式的多任务小样本学习方案作为一种贴合真实业务场景的技术亟待进一步研究。
本次赛题将提供多任务小样本学习自然语言理解数据集,数据集从真实业务场景及网络获取,其中业务数据经脱敏得到。
多任务:赛题覆盖了保险真实业务场景中常见的保险领域、医疗领域和金融领域,包括文本分类、文本相似度、自然语言推断、命名实体识别和机器阅读理解等五大基础自然语言理解任务,具体为18个保险业务场景中的常见任务。
小样本:为了还原真实业务场景中大规模高质量标注数据积累困难的情况,训练集从18个任务中选取了14个作为训练集任务,每个任务提供20条标注样本,共计280条标注样本。测试集从18个任务中选取了14个作为测试集任务,每个任务提供400条测试样本,分A/B榜测试。
本次赛题目标为探索统一范式的多任务小样本学习,比赛提交结果的模型建议为可独立完成所有任务的单一模型,总模型大小限制在1.5G。
由于本赛题涉及多个任务,根据任务不同相应的输入输出不同,具体参考第四节赛题数据。
赛题在赛程中提供开放可下载的训练集及测试集,允许线下建模或线上使用第三方合作伙伴所提供的训练环境及算力。
任务总结:即基于训练集进行模型训练,并对于给定的测试集,输出测试集中所缺失 label 的值。
数据分为单文本分类、文本对分类、命名实体识别、事件抽取和机器阅读理解五大类:
任务名称 |
训练集 |
测试集 |
任务类别 |
保险意图识别-咨询意图 |
20条,包含投诉、转人工、报案、投保咨询、预授权项目咨询与受理5种意图 |
200条*2,同训练集 |
单文本分类 |
保险意图识别-查询意图 |
20条,包含保单详细信息查询、交费信息、理赔金额查询、定损金额查询、查勘员信息查询5种意图 |
200条*2,同训练集 |
单文本分类 |
保险意图识别-变更意图 |
20条,包括变更车辆信息、续期缴费方式变更、客户信息变更、投保人变更、报案信息修改5种意图 |
200条*2,同训练集 |
单文本分类 |
医疗文本分类 |
20条,包括疾病定义、疾病预防、疾病病因、疾病诊断、疾病治疗、疾病预后、疾病表现、疾病检查、疾病并发症9种类别 |
200条*2,同训练集 |
单文本分类 |
金融文本分类 |
20条,包括经营发展、投资融资、政策规章、重大活动、组织人事变动5种类别 |
200条*2,同训练集 |
单文本分类 |
金融情感极性分析 |
20条,包含积极、消极、中性3种情感极性 |
200条*2,同训练集 |
单文本分类 |
保险文本相似度 |
20条,包含相似、不相似两种相似度 |
|
文本对分类 |
医疗文本相似度 |
20条,包含相似、不相似两种相似度 |
200条*2,同训练集 |
文本对分类 |
金融文本相似度 |
|
200条*2,同训练集 |
文本对分类 |
保险自然语言推断 |
20条,包含蕴含、矛盾、无关三种逻辑推断结果 |
|
文本对分类 |
医疗自然语言推断 |
20条,包含蕴含、矛盾、无关三种逻辑推断结果 |
200条*2,同训练集 |
文本对分类 |
金融自然语言推断 |
|
200条*2,包含蕴含、矛盾、无关三种逻辑推断结果 |
文本对分类 |
保险命名实体识别 |
20条,包括保险、年龄、时间、疾病、药品、职业、金额7种实体 |
|
命名实体识别 |
医疗命名实体识别 |
|
200条*2,包括检查、疾病、症状、药物、部位5种实体 |
命名实体识别 |
金融命名实体识别 |
20条,包括公司、地区、时间、金额4种实体 |
|
命名实体识别 |
保险机器阅读理解 |
20条,答案为提供文本中的连续片段 |
200条*2,同训练集 |
机器阅读理解 |
医疗机器阅读理解 |
|
200条*2,答案为提供文本中的连续片段 |
机器阅读理解 |
金融机器阅读理解 |
20条,答案为提供文本中的连续片段 |
200条*2,同训练集 |
机器阅读理解 |
数据分为单文本分类、文本对分类、命名实体识别、事件抽取和机器阅读理解五大类,各自的数据内容格式分别示意如下:
本赛题共分成三个大阶段:
线上比赛(包含A/B榜) ———— 解决方案复审 ———— 终选答辩
本赛题下的线上比赛将设定为两个时间上递进进行的任务。
该阶段内接受个人报名、团队登记(报名登记规则请详细阅读比赛规则)
团队创建需经管理员审核(若正式代表某机构或企业参赛,需机构或企业出具相应盖章函件证明方可建立)。
相关数据集请在「参赛提交」——「下载」下予以下载,A 榜时仅开放训练集和 A 榜测试集,B 榜时额外提供 B 榜测试集。
B 榜:5 月 17 日 0 点自动切换开启,5 月 27日 24 点关闭
AIWIN平台(ailab.aiwin.org.cn)要求所有提交内容统一打包为 zip 文件上传(请参见「参赛提交」tab下「下载」板块提供的提交样例),其内包含:
模型输入测试集后输出的结果文件,文件格式统一为json,名称必须统一为answer.json
json 文件内容规范示例:
{
"MedicalClassification_TRAIN_0": "疾病定义",
"MedicalSimilarity_TRAIN_8": "相似",
"MedicalNER_TRAIN_4": [
"关节",
"肌腱",
"滑囊",
"单关节",
"关节周"
],
"InsuranceMRC_TRAIN_9": "5年、10年、15年和20年",
...
}
其中,键值为每个样本的ID字段,value值为对应任务的预测结果,注意:
1. 请根据label_mappings映射到对应标签;
2. 机器阅读理解任务如果预测为不可答的请映射为空字符串""。
B 榜截止后,排名前20 的团队应向组委会提交解决方案 PPT。
团队简介:团队整体介绍,以及每个成员的介绍、成员分工
拟于 2022 年6 月6-10 日周内(拟)举办终选答辩。入选终选的选手将通过线下或线上的方式参与最终的评审答辩,综合线上排名、终选答辩及命题方考量的其他维度综合确定最终的排名和奖项归属。
线上任务A/B榜采用统一的评价指标,各类型任务采用的指标如下:
EM=1(P==A)
F1=21pP,A+1rP, A, &if P≠∅ and A≠∅ and pP,ArP,A≠∅1, &if P≠∅ and A≠∅0, &otherwise
最终总分采用Macro-F1计算公式如下:
MacroF1=|TASK|iF1taski
综合选手现场答辩、线上排名分数以及其他命题方设定的综合维度(如模型思路创新性都能够),确定最后的综合排名。
(1)竞赛数据:赛事提供的数据仅能用于指定赛道的模型训练工作,参赛人员不得将数据用于任何商业用途。参赛人员不得对外以任何形式转载、发布赛题的训练集、验证集的全部或任意部分;
(2)算法代码:各参赛者应按比赛设定要求提交完整的解决方案(包括代码、模型、文档等),并保证解决方案可独立自主由比赛组织方和出题单位在脱机环境下运行使用,复现结果;
(3)作品提交:作品提交规则按各赛道设定执行。作品提交由单个个人账号执行。参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩、追回奖励(如已发放)并保留追究法律责任的权利;
(4)知识产权:参赛作品(包含但不限于结果文件、算法、模型、方案等)的相关权利由出题单位、参赛者、官方竞赛平台三方共享。
(5)上述约定已在比赛规则中载明,选手报名成功本赛事,即默认选手已阅读并同意比赛规则的所有条款。
类型 |
奖项 |
名次 |
奖励(税前) |
竞赛奖励 (依据综合排名 = B 榜排名 + 复审结果 + 终选答辩排名) |
一等奖 |
第1名 |
60000 元 |
二等奖 |
第2名 |
20000 元 |
|
三等奖 |
第 3 名 |
10000 元 |
|
四等奖 |
第 4-6 名 |
6000 元 |
|
五等奖 |
第 7-10 名 |
3000 元 |
注:
所有获奖选手(含学习奖励奖项与竞赛奖励奖项)将颁发盖有“世界人工智能创新大赛组委会”的赛事证书,对应赛题的证书上将同时印刻有赛事命题方的官方 logo
AI 人才特训营是春季赛事同步过程中,为各层级 AI 学习者、求职者所涉及的集「学习、考核、竞赛、实习实训」为一体的人才培育项目。我们第一批联动了中国工商银行、中国太平洋保险、药明生物、卫宁健康、万达信息、Arefact、SMT(SMG 技术中心)开放暑期实训岗位(6 周培训+驻厂导师带教项目制实训,有实训项目证明和实训补贴[视企业情况])。竞赛达到基线分数以上即可获得面试机会,达到前 100 名获得优先推荐,获得前10直接获得直通邀请。请注意,为参与最终实训资格的获取请在AI 人才特训营页面单独做一次报名
太保科技对于赛事前 20 名的选手将给予实习生绿色直通车,将在实习招聘过程中给予一定优惠(如免笔试等,具体待进一步确定)
线上任务A/B榜采用统一的评价指标,各类型任务采用的指标如下:
EM=1(P==A)
F1=21pP,A+1rP, A, &if P≠∅ and A≠∅ and pP,ArP,A≠∅1, &if P≠∅ and A≠∅0, &otherwise
最终总分采用Macro-F1计算公式如下:
MacroF1=|TASK|iF1taski
综合选手现场答辩、线上排名分数以及其他命题方设定的综合维度(如模型思路创新性都能够),确定最后的综合排名。
本竞赛将预期提供三个不同版本的 baseline
1. 由中国太平洋保险提供的官方 Baseline(已上线,可在参赛提交-下载中下载「2022S-T1太保-A 榜-数据及 Baseline」获取)
2. 由百度飞桨提供的额 PaddlePaddle 版 Baseline(传送门)
3. 由 Datawhale 提供的社区版 baseline (预期4.26 日晚发布)
「AI人才特训营」是一个为在校学生提供AI理论与技能认证学习、考核竞赛并在暑期深入一线企业开展“项目制”实训实践的人才培育项目。自 2020 年起,我们已合作了 12家一线大厂,开放了近 120 个实践岗位,所培育的AI人才涵盖应届与非应届本科和研究生,他们来自复旦大学、同济大学、上海财大、上海理工、清华大学、东南大学、燕山大学、华南理工大学、纽约大学、伦敦大学等海内外院校。
2022 年我们首批合作了 7 家企业,提供包括 AI 工程师、数据分析师、产品经理在内的实训实践岗位:
AIWIN组委会 是2022 年「AI 人才特训营」的联合主办单位,并将 2022 春季赛季作为「AI 人才特训营」的考核方式之一,用于考核选拔学员,取得相应的实践机会。具体AI 人才特训营的过程如下:
更多详情请大家前往官网专题页面了解或直接访问 ailab.aiwin.org.cn
请加 AI SPACE 小助手 (aispace-bot) 并备注竞赛名入群。
AIWIN 百度飞桨AI Studio训练环境
百度飞桨AI Studio平台作为本次比赛的练习场,在A榜阶段为参赛选手提供每天额外1次的成绩测试提交机会,助力大家在大赛官网主赛场中取得优异成绩。
若参与主赛场比赛,选手需登录大赛官网主赛场完成注册报名,并务必在大赛官网主赛场提交初赛及复赛预测结果。
该赛题最终排名榜单以大赛官网主赛场发布的结果为准,百度飞桨AI Studio平台仅作为本次比赛的练习场,欢迎大家参加!
额外提交机会:百度飞桨AI Studio练习场为参赛选手提供每天1次的成绩测试提交机会,助力大家在大赛官网主赛场中取得优异成绩;
免费GPU算力:百度飞桨AI Studio练习场为参赛选手免费提供GPU算力,报名后即可在「数据集介绍」页面获得算力申请地址
点击访问:https://aistudio.baidu.com/aistudio/competition/detail/218/0/introduction
• 脚本任务项目3问
• 数据集1问
• 课程学习5问
平台主要分为项目、数据集、课程、比赛、认证五大部分。
项目:78w+优质项目,覆盖CV、NLP、推荐算法等众多AI热门领域,完美支持Notebook、脚本及图形化任务。
数据集:近6.5w+开放数据集,种类多样,支持数据集预览、下载、上传,单次上传容量高达50GB。
课程:视频、项目、文档三位一体,打造沉浸式学习体验;联合名师,匠心打造体系化课程;免费优质课程,带你快速掌握AI技能。
比赛:成功举办AI大赛70余场,包括新手练习赛、常规赛、高级算法大赛等;比赛持续更新上线中,奖金礼品丰厚,更有招聘绿色通道等你来拿。
认证:深度学习工程师考试由飞桨和Linux Foundation开源软件大学共同创建,通过认证可以获取双重认证,认证人才可以获得百度飞桨人才认证标签、百度AI技术岗位免笔试、生态伙伴岗位联合人才招募“绿色通道”。
AI Studio平台仅支持百度飞桨PaddlePaddle开源框架
请注意,2022 赛季起实名认证都将作为晋级或切榜后成绩有效的前提。
实名认证需通过点击系统右上角用户名处,进入「设定」界面操作。
在此界面请先确认姓名是否为真实姓名,若不是请修改,并点击页面最下方的保存按钮。之后点击「前往实名认证」
在实名认证页面,你需要填入自己的身份证号和手机号(请使用登记在你身份证名下的手机号)
若三者信息匹配即可完成实名认证。如有技术问题,请按页面提示联络我们。
结合2022AIWIN春季赛季赛题,机械出版社华章分社推荐以下书籍,希望能够帮助各位参赛选手取得好的成绩!同时对于优秀的参赛选手也将提供部分书籍奖励。感兴趣的同学也可到 AIWIN 专题书单页面购买(京东专题页传送门,当当专题页传送门)
推荐语:将深度学习方法应用于各种自然语言处理任务,可以让你的算法在速度和准确性方面提升到一个全新的水平。本书首先介绍自然语言处理领域的基本构件,接着介绍使用*的神经网络模型可以解决的问题。深入研究各种神经网络架构及其特定的应用领域将有助于你理解如何选择*模型来满足你的需求。随着学习的深入,你将学到卷积神经网络、循环神经网络、递归神经网络以及长短期记忆网络。在后面的章节中,你将能够使用自然语言处理技术(如注意力机制模型和集束搜索)开发应用程序。
推荐语:这是一部讲解如何基于NLP技术和人机交互技术实现聊天机器人的著作。
两位作者聊天机器人领域均有多年大型项目的实战经验,这本书不仅讲解了NLP和人机交互的核心技术,而且从技术、算法、实战3个维度讲解聊天机器人的原理、实现与工程实践。
推荐语:这是一本能让读者快速从零开始构建工业级知识图谱的著作。作者是知识图谱和自然语言处理领域的专家,本书得到了OpenKG联合创始人王昊奋、清华大学教授李涓子、东南大学教授漆桂林、美团知识图谱团队负责人张富峥、文因互联创始人鲍捷等学界和业界知识图谱扛旗人的一致好评和推荐。
本书不仅详细讲解了知识图谱的技术原理和构建工具,而且还循序渐进地讲解了知识图谱的构建方法、步骤和行业应用。配有大量实战案例,并且开放了源代码,确保读者能学会并落地。
推荐语:IBM研究员Ken Barker及谷歌知识图谱Denny Vrandecic作序推荐,介绍神经网络和知识图谱的结合在NLP中的应用。书中准确地演示了如何创建和使用上下文表示,对意义嵌入和知识图谱嵌入有着明确的处理方法,解释了使用它们的语言模型和Transformer体系结构。
推荐语:为互联网企业的智能平台构建提供了很好的案例参考,也为行业信息化从业者提供了从入门到进阶的技术指导,适合作为自然语言处理、知识图谱、计算机、人工智能等领域从业者的学习指导书,也非常适合对自然语言处理、知识图谱感兴趣的学生和创业团队阅读。
Start: 四月 18, 2022, 8 a.m.
概述: A 榜自 4 月 18 日启动,至 5 月 27 日锁榜。5 月 17 日起 A、B 榜同时可提交,请务必先提交 A 榜,再提交 B 榜。
Start: 五月 17, 2022, 午夜
概述: 5 月 17 日 0 点自动切换入B榜,全程最多10次提交,需有有效 A 榜成绩 B 榜成绩方生效,5月27日24点锁榜
Start: 五月 28, 2022, 午夜
概述: B榜前20名需在5月29日24点前提交解决方案文档,评审团队将综合B榜成绩和解决方案复核成绩后确定晋级队伍
Start: 六月 6, 2022, 午夜
概述: 最终10强公示并通知开展线下答辩,最终答辩将综合第2轮线上排名成绩和现场分数,确定最终名次
七月 31, 2022, 8 a.m.
请登陆来参加比赛
登入# | 用户名 | 分数 |
---|---|---|
1 | yp | 0.795 |
2 | wjn1996 | 0.790 |
3 | yp | 0.788 |