科技唆麻的专栏

科技唆麻

公告

文集

科技(233)

统计

今日访问:1353

总访问量:2193815

百度AI“下乡”:一场大学生的抗虫启示录

2019年12月22日

评论数(0)

三七,盛产于云南,有化瘀止血,活血定痛的功效,民间将其与人参并称之为“北参南七”。


但不为大众所知的是,三七真正与人参一起成为药材的两座高峰,在悠悠长河一般的中医史中并不算久远。它的药用价值最早被云南地区的少数民族发现,直到明代也只被当做西南军队中的金疮药。


( 图:三七药材)


三七真正被广泛使用,一种说法是起源于被收录到《本草纲目》之中。相传,李时珍曾于药材市场中偶遇一云南药商,见其兜售自己从未见过的三七,便上前请教。


药商倾囊相授后,李时珍有意将其买下,但随身钱财尽数而出却依然不足。最后,药商得知面前人的真实身份后,决定将三七作为初交之礼,这才有了日后的“金不换”。


药商与李时珍的偶遇,使三七成为世人的福音提前不知数年;机缘巧合,在四百多年之后,另一位年轻人更因为三七之药效,走上了人生的兴趣之路。


01

穿越深山去看三七


这位年轻人叫徐国秦,她与三七结缘于云南文山。


徐国秦是土生土长的昆明人,但对于三七,若非生病,也不会接触到。徐家有遗传的头疼病,这种遗传在徐国秦高中学习压力最大的时候显现出来了。为了治头痛,中医建议徐国秦吃三七粉。


还记得当时医生告诉她,给她开的三七就是产自文山。


虽然是有名的三七产地,但如今不少农户已经放弃了文山这个地方,因为种植过三七的土地,可能十年都不能再种植三七。


(图:三七山林与种植棚环境)


苛刻的生存条件与漫长的生长周期,使得三七这味中药变得价格高昂。


“当时花了五百多吧,研磨成粉后只有一点点。”


三七治好了徐国秦的头痛,同时也为徐国秦打开了一扇通往中药世界的大门。


通过百度搜索资料,徐国秦初步了解到了三七生长困难及病虫害泛滥的事,但她没料到几年后,在大学里,自己还有机会再次深入接触三七。


2019年炎夏,正值徐国秦通过2019中国高校计算机大赛人工智能创意赛初赛,进击复赛的时期。她初赛时提出的创意构思就是运用人工智能去达到早期防治三七病虫害的目的。


为了收集更多三七病虫害的数据及图片,徐国秦多次前往三七种植基地。


(图:徐国秦采集数据)


说起实地采集数据时的困难,徐国秦自嘲地表示“晒黑了”,但她凭着手机里近两千张三七病虫害图片,俨然成了半个三七“专家”。


(图:徐国秦采集数据)


但山里转了几回下来,徐国秦更多的感受是“心疼”。


对于很多种植户来说,三七是家里主要的经济来源,如果一旦发生大面积的病虫害,这就意味着几年来的心血付之东流。


种植基地的负责人带徐国秦去看地里遭受病虫害侵袭的地方,那里大片植株枯死发黄,曾有人亏损上千万,这对于所有种植户来说都是巨大的打击。


“我出身农村,非常清楚他们对于所种作物的感情,所以很想做点什么帮到他们。”


在昆明晋宁三七种植基地,徐国秦发现600亩的三七地,只有20个左右的工人,他们要对漫山遍野的三七进行一一检查,记录,排除病虫害,发现病虫害后,又配相对应的药水进行人工喷洒。


人工检查预防病虫害,效率低下,成本也高,如果能借助人工智能对病虫害进行实时监测,那三七种植兴许能迎来更光明的未来。


02

跨过专业鸿沟建模


徐国秦是主修计算机科学与技术的,但她对于编程及人工智能的了解微乎其微,并非她没认真学。


“我虽然是计算机专业,但我是师范类的计算机,所以和非师范类的计算机专业学生其实相差很大,我们没有人工智能相关的课,对编程要求也低。”


缺乏专业知识,这也使得徐国秦在参加比赛之初,处于一种非常不自信的状态。


这种不自信还因为自己是单打独斗,接到比赛初赛报名单时,已经临近期末,大家忙着准备四六级或期末考试,无心参加这种比赛,虽然老师建议三人组队参加比较好,但一时找不到队友的徐国秦只好以个人名义参赛。


无论徐国秦如何努力,如何想做点“成绩”,对于一个没有算法基础的学生来说,要建立一个专业的模型是非常难的。


“在比赛之前,我根本不知道EasyDL是什么,为了保险起见,拿到操作手册时还花了三天时间来看。”


随着机器学习,尤其是深度学习在复杂数据上的表现愈加优秀,很多开发者试图将其应用到自家产品中。然而,即使是使用预训练模型或开源框架,于不太了解机器学习算法工程的开发者而言依然是巨大挑战。


EasyDL是基于百度飞桨的定制化AI训练和服务平台,面向各行业有定制AI需求的企业及开发者,提供从数据管理与标注、模型训练、服务部署的一站式AI开发全流程支持。


EasyDL的目标,其实就是让零算法基础的用户,也可以基于自身业务需求和数据,快速训练专属的定制化AI模型。


其实,那个类似“说明书”的东西,只需要花一天就能掌握,这也是EasyDL对于零基础人士的友好之处。


EasyDL为徐国秦免去了算法的过程,只需要上传数据图片,然后就能得到一个模型或接口。听起来是不是非常简单,但收集数据及训练模型却是要付出巨大耐心和努力的。


徐国秦第一次从三七基地采集数据回来后,模型的精度最高只有80%,虽然后续她不断往模型里填数据,进行各种调整,精度不升反降。


“当时真的很苦恼,不知道为什么。”


好在百度EasyDL的技术人员告诉徐国秦,她之所以费了那么多劲,精度还不升反降的原因是,她植入的数据并不平衡,简而言之,不同种类病虫害的数据数量不一,有的多,有的少。


为了达到数据的平衡,徐国秦又前往基地进行了数据采集……


“现在的模型,识别精度已经达到了93%。”


虽然精度达到了,但模型离完善还非常远,由于三七各类病虫害并非都产生于同一季节,有的常见,有的罕见,所以徐国秦建立的模型,由于短时间内数据有限,目前也只能识别7种常见的三七植株病虫害。


(图:遭受不同病虫害的三七)


可这些成果对徐国秦来说已经非常不易。


不同于专业团队,如果机器学习不是产品的核心技术,额外维护机器学习算法团队的成本又非常高,即使不考虑工程化的问题,将机器学习模型部署到客户端也有非常大的成本。


很多时候,普通人可能更需要一种能快速使用高性能深度学习的方法。


EasyDL的存在,使得不少步骤都自动化,普通人能够完全越过算法,只需要收集数据,然后上传标注,再选择合适的模型与参数进行训练,EasyDL训练完成的模型可以在平台上直接申请发布,获得API云服务和离线SDK安装包两种形式的产品,也可以支持直接发布成H5 demo。


整个过程都不会涉及到复杂的算法与工程方面的问题,对于像徐国秦这样缺乏基础的人来说,非常合适,只要借助这样一个平台就能实现AI的“定制”。


目前EasyDL的各项定制能力在业内已经得到广泛应用,在零售、安防、互联网内容审核、工业质检等二十多个行业都有应用落地,并提升了这些行业的智能化水平及生产效率。


03

这是人生的API/SDK


经过对模型的辛苦训练,“三七早期病虫害检测”项目已经初具模型,决赛近在眼前,但仍有一个问题需要思考。


(图:三七病虫害模型训练识别结果)


毕竟专业人士能够通过肉眼识别相关病虫害,虽然模型已经能够识别三七常见的病虫害,但是便捷性和实操性上依然差很多。


在三七园中安装上摄像头,摄像头连接基于EasyDL的API,动态监测三七的生长情况,随时随地反馈发生病虫害的植株,徐国秦的项目才算是真正落地。


决赛结束,徐国秦获得了2000元的奖金,她把这笔奖金称为自己除了奖学金以外的“第一桶金”。


既然这样的模型能够检测三七病虫害,是否意味着对其他中草药也能适用?比如重楼,再比如天麻……这是否意味着EasyDL将承担起更多的社会责任?


“我好像知道自己接下来要做什么了。”


“通过这个项目,我对人工智能和编程都产生了前所未有的兴趣。”


在众多通过百度走进AI世界的人中,徐国秦是最普通的一个,也是最具有代表性的年轻人之一,如果不是2019中国高校计算机大赛人工智能创意赛,零算法基础的她可能很难有机会去深入了解AI。


(图:中国高校计算机大赛人工智能创意赛参赛选手现场演示各种“硬核”设备)


一个为零基础人士诞生的EasyDL,不仅让徐国秦初步实现了自己帮助三七种植户的愿望,还激发了自己对人工智能的兴趣。


事实上,为三七防治病虫害只是百度AI赋能各行各业中一个很小的例子。通过中国高校计算机大赛人工智能创意赛的选手作品,我们能看到学生们将百度AI技术能力应用于各行各业——比如中南大学团队用百度飞桨开发了基于临床图像和病史数据的皮肤疾病全病种分类系统,以小程序为载体,操作简单零门槛,诊断专业,解决了看病难的问题,对智慧医疗有非常重要的意义;北京邮电大学团队开发的基于百度飞桨的视觉辅助智能眼镜系统,帮助视力障碍人士完成“日常行走”、“寻找物体”基本生活需求,使其成为盲人的第二双“眼睛”;浙江工业大学团队使用EasyDL提供的图像分类模型,做出了超市智能补货机器人,大幅降低了无人超市的运营成本,让工作人员从此告别夜间补货……


除了帮助学生的“脑洞”落地,百度大脑AI开放平台也已经广泛应用于农业、工业、医疗、零售等各项产业智能化升级中;又如AI寻人,通过人脸比对技术,实现了家庭的团聚。截止到今年6月,百度AI寻人已经帮助6700个家庭团圆。除此之外,还有AI助盲行动、AI助老兵圆梦等等这些案例。


众所周知,越是需要专业的技术,则意味着越容易出现人才荒。按照国内教育部门的测算,国内AI人才的供求比例为1:10,缺口超过500万。


面对人才短板的棘手问题,不少高校闻风而动,已经有70余所国内院校开设人工智能相关专业,却也频频出现对现有模式的质疑。


作为中国人工智能领域的布道者,百度也开辟出了自己的人才培养之路。


一方面,百度通过与各级政府部门、各大高校联合举办各项AI竞赛,提供飞桨深度学习框架平台、EasyDL定制化训练服务平台、AI Studio平台,先进的技术、导师指导、资金支持,赋能高校人工智能人才教育,帮助学生快速成长为研究能力和实践能力兼具的复合型人才。


另一方面,针对AI教师稀缺、原理与实践不协调的问题,百度在全国开展深度学习师资培训班,培养超过1000名高校一线教师。同时参与编撰《深度学习导论与应用实践》等人工智能教材,上线了多门基于飞桨的免费精品课……


中国社会科学院社会学研究所2018年底发布的《2018百度社会价值报告》显示,百度已经为整个业界培养了近55万名人工智能相关人才,极大激活了当下匮乏的AI人才市场。


百度联合深度学习技术及应用国家工程实验室等机构发布的《深度学习工程师能力评估标准》,弥补了国内深度学习工程师认证考试方案和体系化的深度学习人才培养方案的空白。并基于此标准,针对不同层级从业者开展零基础深度学习集训营、PaddleCamp未来深度学习工程师集训营、AI快车道-企业深度学习实战营、黄埔学院-首席AI架构师培养计划,为企业从业人员提供更专业的学习平台,帮助企业培养AI技术人才,从而整体推进AI人才的培养。


这样的愿景正合李彦宏为百度提出的“Everyone can AI”的理想。


百度大脑AI开放平台上的技术能力或许只是最后为你提供一个API或离线SDK,但对于诸多像徐国秦这样有想法的人来说,人生的一切才刚刚开始,对于整个百度的人工智能蓝图来说,未来更加可期。


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+科技唆麻。