年终复盘与展望(2017年)

“2013,给自己的评分是不及格;2014,总算是步入正轨;2015年,努力让自己心安理得;2016年,不能说不努力,但感觉遇到了一些瓶颈。” 2017,完成了诸多人生大事,成了家买了房,算是重要的承前启后的一年吧。

17年可以说是大事不断,5月换工作,7月硕士毕业,9月上女朋友家门,10月父母来上海同女朋友父母见面并且开始看房子,18年1月和女朋友领证之后开始进入买房交易流程,2月拿到房产证把老婆带回福建老家拜年。去年的复盘里说到:“希望16年是承前启后的一年”,看来17年才是真正的承前启后年……攘外必先安内,家和万事兴……这一年,娶到了心仪的体贴的姑娘,完成了买房大事,有了稳固的大后方希望自己在事业上也能蒸蒸日上吧。 继续阅读年终复盘与展望(2017年)

年终复盘与展望(2016年)

“2013,给自己的评分是不及格;2014,总算是步入正轨;2015年,努力让自己心安理得。”2016年,不能说不努力,但感觉遇到了一些瓶颈,希望是承前启后的一年吧。

往年的年终总结都只写工作,今年开始把工作和生活都记录一下,然后以复盘和展望的形式结束一年开始新的一年吧。 继续阅读年终复盘与展望(2016年)

工作第三年(2015)小结

往年的年终总结都是放在元旦跨年时写,但细想之后还是觉得放在春节写来得合适,毕竟春节前往往是最忙最有事情做的时段,只有回到家之后这一年的工作才算完。但是年后发生了各种事……所以拖到了今天才做总结,还是得过去的15年一个好好的交代。

“2013,给自己的评分是不及格;2014,总算是步入正轨”,2015年,应该说是努力让自己心安理得吧。

CS229

CS229是Andrew Ng在斯坦福大学开设的一门机器学习课程,相信非常多的同行是看着这个公开课入行的,向Andrew和提供视频翻译与课件的网易公开课脱帽致敬!这里就引用一下当时学完监督学习部分前11课后的总结吧:“从过年期间(第一篇笔记发布于2月24号)到清明假期(今天4月5号),历经40天左右的时间终于把CS229监督学习的部分过了一遍。期间解开了无数困惑已久的机器学习领域的问题,感觉整个人神清气爽。感谢网易公开的翻译,并且细心地提供了讲义下载,当然更感谢Andrew大神的精彩授课。接下来需要先掌握一个好的工具箱;然后开始践行先Implement something quick-and-dirty,再通过error analyses优化重点环节。像个ml专家一样去战斗!”

复旦研究生

担心未来本科文凭不够用,所以14年报考了复旦大学软件学院云计算大数据方向的工程硕士。15年3月开始正式上课,也拉开了周末单休的序幕。虽然陆陆续续还是延续了大学时翘课的习惯,但是在这里认识各行各业的同学,交到了有趣的朋友,还能及时向资深的教授以及教授带的全日制研究生同学请教,收获颇丰。 继续阅读工作第三年(2015)小结

不做就不做,要做就做最好

最近其实不太顺利,做了四个月的搜索项目总算在论坛PC端上线了,自认为合理的排序算法并不被老用户认可,改为和老版本使用一样的时间降序排列后得以使得新老版本的数据表现相似,可惜新版搜索的点击数据还稍逊一些;再加上App端在过年前要接入搜索功能,使得最近不得不来了一阵疯狂加班,也因此腾不出来优化搜索算法;并且还有搜索产品化的需求堆在哪儿;另外我厂在局面大好的情况下,硬生生被利物浦扳平了,sigh……

周五,实在加不动班了,回家想刷一刷GTA3的剧情也打不起啥精神,于是打开豆瓣电影,想找找足球相关的电影,然而没能找到理想的结果……好在突然想起体育相关的内容肯定还是要来我大虎扑搜索,于是用了自己设计的综合搜索算法,瞬间找到了一篇关于足球电影的讨论,算是给了自己一个大大的安慰吧。

一番挑选之后,决定看《一球成名》,一部讲述社会底层的业余球员如何被球探发现,最终实现自己职业球员梦想的励志片。整体来说是部不错的电影(槽点是一些细节比较生硬)。我对整体电影感触最深的不是励志鸡血,而是以下这个画面:

一球成名

继续阅读不做就不做,要做就做最好

博客能不停就不要停

由于SAE的各种不稳定,这个博客荒废了好久。最近由于工作需要开始鼓捣阿里云,学了一些Linux知识后,总算顺利把博客迁移了过来。在继续写技术博客之前,还是先记录一下这段时间的生活,给这半年一个交代吧。

arenacloud

首先,我的虎扑邮箱马上就不能用了(泪目),因为我们数据部门加入了虎扑系的子公司——动云(arenacloud),今天A股上市公司贵人鸟(603555)宣布重点投资以大数据为核心的体育生态圈之后,似乎股价又涨了。然后,具体干活的应该就是我们。

搜索

这几个月来我主要负责的项目是虎扑的全站搜索(包括主站与虎扑体育App),虎扑的论坛上真的沉淀了许多优质内容,希望尽快上线,找科普知识大家想到的会是知乎,找体育知识那肯定得是虎扑咯。

算法、服务端语言、Linux命令

继续阅读博客能不停就不要停

工作第二年(2014)小结

2013,给自己的评分是不及格;2014,总算是步入正轨。

1月,感谢老严

向老大提了不想做产品而想专心做数据的想法,非常幸运地被批准了。真的非常非常感谢老严,从此我得以开始拼命地学习。当然,一开始的时候是十分盲目的,比如这个月我从关联分析和聚类算法切入,开始研究数据挖掘。同时学习了一款叫orange的数据挖掘软件,就开始吭哧吭哧地结合业务数据想做出些成就了。结果当然挖掘出没什么意义的信息。

2月,尝到甜头

1月算是把数据挖掘中两个很难产出漂亮结果的两个坑给填了,2月开始研究了分类相关的算法。硬着头皮,半知半解地看完了决策树、朴素贝叶斯、人工神经网络、SVM和一些组合分类器(如:随机森林)给看了个遍。然后用了最简单的决策树做了一个游戏大户预测模型:利用用户进入游戏后前一周/前二周/前三周的表现,预测两个月后他的充值能否达到我们的大户标准。最终和业务人员深入沟通和自己仔细观察了数据特点后算了几个比较特别的feature,在测试集上用交叉验证准确率和召回率都能达到70%以上。对于一个自己鼓捣的菜鸟来说真是感觉美滋滋的,当然,我们公司的业务人员以及高层对数据和模型的认知不足,最后没能马上应用到游戏联运部门的日常工作中去。

对了,2月的前半个月我去了趟美帝,和金门大桥合影、逛了硅谷、在三藩市参加了一场hackthon、沿着1号公路从三藩市自驾到LA、在LA看了人生第一场NBA现场比赛(快船VS开拓者)。

3月,恶补统计学

虽然2月的研究小有成就,但很明显地感觉到自己欠债很多,半知半解地去用机器学习太危险了。再加上步子迈大了容易扯着蛋,业务人员比较容易接受的是“可解释”的研究成果。于是我开始恶补最基础的统计学,从最简单的描述性统计开始复习,一遍一遍地去理解区间估计和假设检验,接着看了著名的回归以及方差分析。同时,顺便也把SPSS给学习了一下,于是开始通过假设检验来更合理地对比我们电商部门的不同商品发布策略。 继续阅读工作第二年(2014)小结

2014知识补全计划

很幸运,我有一个开明的老大,跨年那天的抱怨文章转给他看之后便得到了尝试做纯数据工作的机会。

截止今天,看完了2本自认为很有用的入门读物《数据挖掘导论》《统计学》,学习了两个软件orange与spss,完成了三篇对公司业务情况的专题研究(游戏用户聚类;游戏大户预测;电商优惠信息发布策略),对了,年后还去了趟加州……

作为半路出家的data engineer,自然关注了一批奋战在一线的数据工作者。看完他们的博客,真的会对数据肃然起敬,知其然而不知其所以然的话,可能连自己都没法说服更不用说要让老板和业务方信服了。对自己和这些硕士博士的差距深感焦虑的同时,理所当然地,定下了14年的目标——补全基础知识: 继续阅读2014知识补全计划

工作第一年(2013)小结

2013,给自己的评分是不及格。

7月,好像玩得比工作多

入职第一周各种叙旧(3月份实习过一个多月),各种找状态,七月很快就结束了。这时我也大概得知了在公司的两个主要工作:数据分析平台DACE与比赛中心。

8月和DACE的“亲密”接触

DACE和比赛中心都算是大项目,不过DACE是探索性的数据产品且需要和公司各业务部门深度联系,而前辈对比赛中心的评价则是“只要不出错就好了”,因此我毫不犹豫地将精力全部投入了DACE。这个真是混乱而压力巨大的一个月:1.需要花大量的时间在与业务部门负责人的沟通上;2.当时嫌麻烦不想学axure直接用ps来画原型图没想到造成了更多的麻烦; 继续阅读工作第一年(2013)小结

做产品时的心境,一定会被用户看到

正式工作快要两个月了,博客也几乎停了两个月。之前计划的NBA数据挖掘系列与帝国时代编年史系列看起来一时半会是难以继续了。原因很简单:连周末都在填平时工作的坑,难得有空的时候宁愿看几集《银魂》。

既然说到银魂,那就以此说说最近感触最深的几点吧:

1.真羡慕空知猩猩啊(银魂的作者)。抱着随时可能被《JUMP》腰斩的心态,创作了一部极其“随意”、极其无节操、极其个人化的作品,获得了如此多的脑残粉。前面刚让你笑,马上就可以让你哭;即使只是吐槽生活中的琐事也能让人乐此不疲;没有什么事物是不能恶搞的……看似随意其实十分认真,我也想做出这样的产品阿鲁。

万事屋

2.美好的感受真的会长驻于心。 继续阅读做产品时的心境,一定会被用户看到

开篇——python,nba 还有我的生活

筹划了很久的博客终于要开始了。

这里会是一个“杂”的地方:我会把平常写python的一些心得整理上来;会写一些基于数据挖掘的NBA球队建设或者球员交易方案;会写工作后的生活;甚至会写儿时最喜欢的帝国时代2兵种相克关系研究与各个帝国的真实历史。

我觉得杂没有什么不好的(这里借用一下about me中的图片)。现在越来越多的工作只有杂交才能胜任了,具备多种能力后能够完成少数人才能胜任的工作也是一种享受吧。

其实,作为一个python语言的簇拥 继续阅读开篇——python,nba 还有我的生活