本篇文章1540字,读完约4分钟
“父子团队”参赛照片
50万用户,超过100亿条数据,找出谁将在下个月更换手机。你会做这道数学题吗?别数了,光是看数据就让人眼花缭乱。绍兴的一位“80后”爸爸实际上解决了这个问题。由他创建的一套算法已经过专家评委的测试,准确率达到27.61%。凭借这一成绩,他获得了首届全球数据资源开发大赛和2018年数据技术大数据建模与创新应用大赛(以下简称WDD大赛)的亚军。
这位“80后”的父亲,苗华,在绍兴市住房公积金管理中心工作。"通常的工作是处理数据。"他说大数据分析是他的爱好。
唯一获奖的人
今年2月底,WDD竞赛颁奖大会在杭州国际博览中心举行。与其他获奖者不同,苗华是唯一一个获奖的人。"我羡慕他们都有一个团队。"苗华说,参加这次比赛的主要原因是为了和有共同兴趣爱好的人交更多的朋友。
WDD竞赛于去年10月开始。在中国互联网协会的指导下,这是一场国际性的新型竞赛,由公司以市场为导向的创新应用驱动,吸引了来自世界各地的512个大数据开发团队参加竞赛。不仅有来自清华大学和HKUST大学的团队,还有来自ksssssss和云起如梦等初创企业的团队。经过预赛、半决赛和决赛,苗华获得了亚军。
但是苗华心里还是有点后悔。从预赛到半决赛,他的算法准确度遥遥领先,排名第一。但在最后阶段,当话题一宣布,苗华就觉得自己的脑子不够用了。原来,总决赛的数据量突然从数亿扩大到数百亿。虽然回答时间是一个月,但苗华的空余时间非常有限。"根据模型计算的所有数据需要六七个小时."他说。
苗华刚刚独自完成了它。
曾是微软的工程师
对许多人来说,大数据算法是一个奇怪的概念。在大数据时代,数据挖掘是核心工作。它依靠“算法”来发现隐藏在海量、不完整和随机的大型数据库中的有价值的信息,从而支持决策。
"例如,给你100,000个客户信息,计算谁会恶意欠钱."苗华说,设计算法的过程是通过高度自动化的大数据分析、归纳推理来挖掘潜在的模式,这种模式被称为“算法”。
苗华怎么能钻研这么高深的学科呢?十年前,苗华是微软亚洲研究院科技部的软件工程师,曾被微软亚洲研究院评为“后起之秀”。后来,由于家庭原因,他回到了家乡绍兴工作,但在内心深处,他一直对数据挖掘等基础科学研究领域保持着浓厚的兴趣。"申请绍兴市住房公积金管理中心也是要数据的."苗华说。
近年来,苗华带领同事成功开发了“绍兴公积金”第一代手机APP、自动运维系统和数据备份系统,使全市住房公积金管理信息化在全省处于领先地位。“交给他没问题。”苗华给领导和同事留下的印象是,他有一个超级大脑。
"他是绍兴为数不多的数据分析人才之一."麻省理工学院博士、我市大数据专家张晓明是苗华的朋友。
茶馆里的“数据风暴”
2017年的深夜,在岳城区东部的一间茶室里,“PageRank,HITS,LOGMSOM……”几个人低声说了这些奇怪的话。这些词是大数据的“算法”。"我没想到绍兴会有这样的人才."说起苗华,张晓明的眼睛发亮。
"张老师给了我很多想法."苗华表示,虽然他从事数据运营管理,但大数据分析的实际机会并不多。正是在张晓明的鼓动下,他试图通过参加全国性和全球性的比赛来提高自己的数据分析能力。
2017年,他参加了全国大数据建模竞赛,这是他第一次参加竞赛。我不记得有多少个晚上,张晓明给了他小心翼翼的建议,帮助他敞开心扉。那一次,他赢得了冠军。
引人注目的是,组织者邀请团队参加比赛,并展示了团队风格。无奈之下,苗华抱起两岁的儿子,留下了一张“父子团队”的照片。“我非常希望找到一个有共同爱好的小伙伴。今年我们将组织一个团队参加比赛,为绍兴争光。”采访结束时,苗华发出了诚挚的邀请。最近,他应邀参加了绍兴“都市大脑”的建设。
边肖:何超群局长陈文华
标题:绍兴的“80后”打出了大数据,打出了大动作
地址:http://www.sihaijt.com/sxzx/9344.html