历时一个通宵,两个白天,60多G的数据终于分发到上百台计算机。200多平米的实验室空荡荡,只能听见计算机运行的声音。数天后,这里将坐满学生,键盘声此起彼伏。
实验室里100多台电脑搭载了PaddlePaddle,静静等待第一批使用的学生
边教边学,大学教师也需打怪升级
许云峰是河北科技大学信息学院计算机系的副教授,负责教授本科的人工智能和大数据课程,他与同事李媚、白宇和张妍同为大数据课程组的老师。在各高校陆续开设人工智能专业,AI领域加速快跑的时候,两个问题一直困扰着许云峰:师资力量严重不足,缺乏实验环境。
这两个问题同样困扰着其他高校教师。今年上半年,教育部印发《高等学校人工智能创新行动计划》,并推出国内首个高校人工智能人才国际培养计划,力争五年内培训顶尖高校至少500位AI教师、5000位AI学生。但是可支持资源少、缺少经验指导是事实,很多老师自己都不会,只能边教边学,无形中提高了学习的门槛。
“人人都有平等学习和使用AI的权利,不能因为技术门槛将学生拒之门外。”许云峰说。2013年,许云峰第一次接触 学习技术,他意识到“ 学习技术是目前人工智能领域中最成熟、与实际应用最近、可扩展性最强的一项技术,选择 学习技术作为教学和科研的切入点,既可以促进本科生的就业,又可以促进研究生和教师的科研工作。”然而努力了半年,效果并不理想——没有专业的实验平台,没有真实数据,算法光靠“努力”成不了。
使用Paddle、参加培训班,学习AI的最佳时机被他抓住
2016至2018年,出现了两个转折点。
其一,百度于2016年宣布PaddlePaddle开源。经过长期试用,许云峰认为“PaddlePaddle是目前我们尝试过的最容易上手的开源 学习框架,没有之一”。作为教师,他很看重框架的易用性,“学生可以非常轻松地设计网络、调整参数,并设计新的算法,进而解决科研项目中的实际问题。”自那之后,许云峰老师所在的实验室一直在尝试用该框架解决科研和工程问题。
其二,2018年5月,百度举办了信息技术新工科产学研联盟 学习师资培训班,许云峰、李媚、白宇和张妍就在其中,在与资深人工智能专家的交流中他逐渐补齐了知识短板。在课程结束后的交流分享中,许云峰承诺:在河北科技大学已有的实验环境上,开发基于PaddlePaddle的人工智能和大数据实验系统,降低学生学习人工智能和大数据的技术门槛,使人人都有平等学习和使用AI的权利。
缺乏实验环境?于是他给百度打了个电话……
许云峰做出这样的承诺,心里还是有把握的。
在百度举办的 学习师资培训班上,他和课程组同事已经将PaddlePaddle 学习开源框架的基本的知识与操作技巧了然于心。培训结束后,参训教师、授课专家建起了微信群。来自不同高校教师经常就教学实践中遇到的问题在群里讨论,寻找最恰当的解决方案,为他们后期的教学活动提供持续性的保障。
在师资问题逐步得到解决之后,摆在许云峰面前的是一个很实际的问题。“学院的机房没有进行人工智能相关实验的软件环境,学生们更不可能配置相应的硬件设备。”这一问题如果不解决,开设相关课程则沦为空谈。
许云峰给百度 学习师资培训班的组织者之一、PaddlePaddle运营高级经理谢梦打了个电话,“我需要你们的数据,需要你们的平台提供帮助”。在了解到许云峰团队的困境之后,谢梦马上找到了百度AIStudio的产品经理靳伟。
AI Studio是封装好了PaddlePaddle运行环境的AI实训平台,在云端集合了AI教程、代码环境、算法算力;加上其一站式的设计,为初学者准备了多个领域的不同模型范例,以及数十个经典数据集,供学习练习使用。
靳伟了解许云峰的需求后,立马给出肯定答复:“AI Studio愿意为河北科技大学和许老师提供帮助,也肯定能满足他们的需求。”
获得了技术支持,课程组终于能全身心投入大数据和人工智能实验系统的开发。许云峰和百度持续沟通开课细节,课程设置、教材编写、软硬件布施,事无巨细。百度也乐意为老师们提供全天侯的PaddlePaddle开课服务。百度校园品牌部的项目经理张倩与许云峰沟通最为密切,“可能一周有3到4天都会和许老师沟通。我和我同事们的邮箱,几乎天天收到老师发的项目进度、新的需求。能帮助老师们成就一件从无到有的事,我也很开心。”张倩说。
开设PaddlePaddle 学习开源框架相关课程的基础条件已经具备。此时,距许云峰参加 学习师资培训班仅过了4个月。
报名人数一口气破300,开课模式可以复制?
9月18日,经过2个白天1个通宵,60多G的数据集被上传到100多台电脑主机。由许云峰与同事以及大数据实验室多位研究生、本科生,历时14人月开发的人工智能和大数据实验系统,正式宣告完工。该系统整合了百度开源的 学习框架PaddlePaddle和一些人工智能和大数据的相关实验案例,可以让学生在4G内存+I5CPU的普通PC上运行人工智能和大数据实验,大幅度降低了学习人工智能和大数据技术的技术门槛。
他在培训班的微信群里发了一句话:“我们上次开会吹的牛,终于兑现了。”
根据许云峰及团队的规划,他们将在原有课程《大数据应用技术》基础上引入PaddlePaddle 学习开源框架的相关理论与案例,形成“大数据+ 学习”的全新课程。在原有课时的基础上新增22课时,从应用的角度融合了大数据和人工智能两个学科的知识和相关案例。许云峰希望这门课程的落地,可以增强本科生在就业市场中的竞争力,增强研究生的科研能力。
目前,该课程报名人数已经突破300人,大二、大三学生及研究生尤为热情。虽然涉及PaddlePaddle的课程到10月份才正式展开,但大部分学生已经将20多G的实验系统安装到自己的笔记本上,先做一轮“预习”。
9月20日,许云峰在培训群里又发了一张相片,空旷的实验室已经坐得满满当当:第一波学生已经开始实验了。
河北科技大学向“人人都能学习、使用AI”的愿景迈出了第一步
研究生们在实验室里讨论方案
他将一个网盘链接发在群里,说:“关于我们搭建实验室系统的资料,都在这儿了。平台搭建工作告一段落,后续工作是做应用案例了。”他希望,借助他和团队的分享和经验,后续能有更多的高校搭建实验平台,帮助老师与学生更好地融入到中国高校人工智能队伍中来,人人都能学习、使用AI。
智能相对论(微信ID:aixdlun):深挖人工智能这口井,评出咸淡,讲出黑白,道出vb深浅。重点关注领域:AI+医疗、机器人、智能驾驶、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。