联系客服
客服二维码

联系客服获取更多资料

微信号:LingLab1

客服电话:010-82185409

意见反馈
关注我们
关注公众号

关注公众号

linglab语言实验室

回到顶部
公文自动校对挑战赛来啦

218 阅读 2021-11-22 09:13:27 上传

会议讲座: 会议

时       间: 2021.10.29~2021.11.27

形       式: 现场

人       数: 待定



2021“曙光杯”江苏省高校人工智能应用算法挑战赛,内容源于中科曙光在人工智能行业应用落地过程中发现的通用性技术需求,旨在通过比赛形式,广邀外部人才,征集优秀技术解决方案,促进产学研合作和产业AI人才培养。作为产教融合的先驱企业,中科曙光一直致力于大数据产业人才培养。曙光2016 年率先与教育部学校规划建设发展中心共同发起教育部产教融合促进计划—“数据中国,百校工程”项目,以推动高校应用型转型改革、支撑国家大数据战略为目标,兼具应用型人才培养、科研创新和行业应用服务功能。截止2021 年7月,服务学生超过15000名;行业应用有超过 100个正在开展的项目,超过 200 个意向项目,涉及教育、农业、信息安全、旅游、交通、健康等领域。






参赛指南

01

参赛指南


(1)面向对象:不限

(2)参赛方式:参赛者可以个人或团队(1-4人)的名义参加比赛,团队名称自取。组队参与的参赛者每组须选出一名队长,负责团队报名和作品提交。


02

赛程安排


(1)报名与参赛:10月29日-11月27日

(2)成绩公布:12月4日

(3)优秀者答辩评奖:12月


03

参赛说明


(1)参赛作品应符合本届大赛的主题;

(2)作品必须为参赛者原创,且不侵犯他人知识产权;

(3)大赛主办方享有免费对参赛获奖作品进行部分或全部复制、发行、信息网络传播、展示、翻译、汇编以及其他形式使用的权利,作者拥有署名权。

图片

第二届曙光杯挑战赛答疑群(QQ群号:809026941)




比赛内容

01

课题背景


公文写作是政府机关日常办公过程中的重要活动,承担着传达政策指令、讲话精神、时事情报等重要任务。书写规范正确是一篇好的公文的基本要求,公文发布前,经常需要写作者花费大量精力仔细校对和检查其中的书写错误情况,通过自然语言处理技术,将文本纠错过程自动化,可以节省用户大量精力,提高写作质量。


02

作品要求


通过代码自动识别出给定文章段落中的写作错误,包括同音字混淆、形近字混淆、多字、少字等情况,给出正确的文本内容。


03

数据说明


(1)数据为互联网公开语料,内容为各类政府网站公文,格式为txt,有一定概率存在写作错误。

(2)错误分成同音字错误、形近字错误、多字少字等三种情况,给出训练数据1000条作为参考,测试数据与训练数据同分布。


04

输入输出说明


(1)输入数据存放于代码运行目录下,名称为input.txt

(2)代码输出数据应存放于运行目录下,命名为output.txt

(3)输入数据格式如下:

1

精各单位广格落实情况报送制度,于5月10日前上报老旧小区安防综合整治建设方案,于每月30日前上报一次综合整治工作进展情况,12月20日前上报综合整治工作总结

2

专家组充分肯定了规划的研究成果,认为改规划数据充实、分析细致、规划到位

3

请各管部闭门于2020年7月20日前,将审核同意的申报材料一式15份寄至交通运输行业重点科研平主任联席会议秘书处,逾期不予受理

(4)输出数据中,应用【】将错字框出,并在最后用|分割,按顺序给出正确的字;对于少字情况,用空括号在缺少部位标记出;对于多字情况,在最后正确结果里用_表示。输出数据格式如下:

1

【精】各单位【广】格落实情况报送制度,于5月10日前上报老旧小区安防综合整治建设方案,于每月30日前上报一次综合整治工作进展情况,12月20日前上报综合整治工作总结|请严

2

专家组充分肯定了规划的研究成果,认为【改】规划数据充实、分析细致、规划到位|该

3

请各【】管部【闭】门于2020年7月20日前,将审核同意的申报材料一式15份寄至交通运输行业重点科研平台主任联席会议秘书处,逾期不予受理|主_


05

提交要求


(1)参赛者需将代码以及部署说明打包提交

(2)代码不能联网,不能调取外部接口

(3)代码的输入和输出形式需符合统一要求,详见上一节

(4)参赛者可根据提供的样例数据自行扩充训练数据集

(5)参赛作品将从精准率、召回率、识别速度等方面进行客观评价,结合评委意见,作为评奖依据。

(6)测试数据集作为测试参赛作品指标的依据,在比赛结束前不对外开放。


06

比赛语言


Python


07

评奖规则


(1)代码提交准确率 

(2)代码提交速度

(3)代码提交质量


08

作品提交


(1)代码作品提交邮箱:

competition_sugon@163.com

(2)邮件标题:

姓名+手机号


*比赛数据见原文链接

图片
图片









参赛奖励






图片

01

比赛奖励


奖项名称

获奖名额

奖励内容

一等奖

2支

¥10000元/支,5W核时(可转成5000卡时)

二等奖

3支

¥5000元/支,3W核时(可转成3000卡时)

三等奖

5支

¥1000元/支,1W核时(可转成1000卡时

参与奖

若干

精美礼品,5000核时(可转成500卡时)

注:(1)获一、二、三等奖的参赛队伍每队每人皆可获得证书一张。

       (2)核时卡时为实验算力,主要指能够使用计算设备跑代码的时间,实验算力时间。

       (3)参与奖为参赛者参与比赛都可以获得曙光Logo的小礼物。


02

招聘直通车奖


所有参加比赛并提交作品的学生团队,可获得面试卡,可适用于中科曙光南京研究院2022届校招。

主办单位:

江苏省人工智能学会   中科曙光南京研究院

承办单位:

JSAI自然语言处理专业委员会    南京航空航天大学先进计算产业学院


点赞
收藏
表情
图片
附件