2024事记¶
本页统计信息
-
本页约 6839 个字, 预计阅读时间 23 分钟。
-
本页总阅读量次
一眨眼,今年又快到头了,依然是在差不多的时间,差不多的地点,用凑合着用的键盘和写作能力,记录这凑合着过的2024年。
前情提要:从去年九月份开始,脑子里关于读博的想法逐渐产生。当初保研的时候毅然决然地选择了读个硕士,博士什么的绝对不会去碰的。结果也不知道为什么,干了两年活之后反而冒出了试试读博的想法,不过那时候处于一个什么成果也没有的状态,组里为数不多的博士名额也早早预定了出去,所以最后也没转博成功,2024新一年的记录大概就是从这里开始的。写的有点长,有点流水账,希望点进这个页面的你有足够的耐心听我絮絮叨叨到最后。
其一、莫失也莫忘¶
没头脑和不高兴¶
今年似乎是开局不顺,去年年底的时候,从年初开始的几个工作陆续变成了论文,先后投了出去,一个是顺应时代潮流做的新课题,在挖新坑的边缘来回试探,最终终于把自己送进了坑里,我们暂且称这篇文章为没头脑;另一个则是在前几年的各种笔记中吐槽已久的合作项目的产出,我们把这个工作称为不高兴,这个工作非常努力地把一堆处理数据的过程解释成是自己的创新点,大概就是别人用驴来拉传统的磨,经过我们的精心改进,拉磨改为用电驴在线上进行。想那驴应该也是不甚高兴的,你说我辛苦拉磨,怎么就被白白抢走了就业机会,驴这么一想,似乎连吊在眼前的胡萝卜也不怎么香了。
没头脑和不高兴的初版成稿的时候看着就非常没头脑,自然也就让审稿人不高兴。因此,他们在初次投稿的过程中也是不出意外地出了不少意外,第一篇文章收到了两极分化的评价,虽然每条审稿意见都回复了很长一段话,但终究是没什么用。
在一个阳光明媚,云销雨霁,万里无云又阴云密布的下午,我正打算睡个午觉,忽然就收到了师兄发来的急电,说怎么这篇论文寄了,赶紧打开收件箱看看,害,得了,继续睡吧。过了十天之后另一篇论文也开奖了,不出意外地也被拒了。这时候已经是二月,本来已经打算明天回家开始过年,大清早收到拒稿邮件之后,一怒之下我立马改签了高铁票,收拾完东西今天就赶紧回老家了。
牢方向¶
这两个工作是大方向转型之后的新工作,初期的探索确实遇到了各种各样的问题,而在漫长的等待审稿意见的时间里,我对入门时开始做的老方向又有了些新的想法,于是又回过头去在老方向上做了一个工作,一月底的时候抱着碰碰运气的心态投到了信息检索的顶会SIGIR。
高情商:对老方向有深厚的感情没法切割,低情商:在舒适区里打滚想继续水论文
过年休假期间稍微改了改被拒了的没头脑和不高兴,分别又转投了一次,然后就休息了几天混到了下个学期开学。这期间自己给老方向收尾的论文在经历多重磨难之后被一个B类会议接收,有种如释重负的感觉,想着坚持了两年多的老方向总算是有了一点还不错的产出,也算是没白来。
其二、迷途亦徜徉¶
从MyGO开始的MyGO¶
其实寒假在家休息的时候,脑子里偶然间闪过了一个大胆的想法,大致构思了一下之后回学校就开始动手,几个月之后做出了一个新的工作叫《MyGO: Discrete Modality Information as Fine-Grained Tokens for Multi-modal Knowledge Graph Completion》挂到了预印本网站上。
起初只是一个简单的想法,这帮看MyGO看疯了的人什么狠活都能整出来(先说明一下我还没疯,至少没完全疯),我能不能也整一个。当时正好在酝酿一个新的想法,想把在用一些“时髦”的新技术改造老方向一直以来的范式,于是这篇论文的标题和方法名字就这么定了下来。
整个idea意外地非常效果还行(其实主要是因为方向小,注意到的人不多),所以做了一通实验之后把文章写了出来,方法名字的缩写就叫MyGO,这四个字母都是从方法的命名中断章取义过来的,当然这也是计算机科研的老传统了,之前见到过的似乎有EVA,FGO,以及Genshin,想来是搞计算机的这群牢二次元多少有点喜欢悄悄地夹带点私货。
写文章的过程中花了不少时间制作了几张插图,比如主视觉图的配色参考了MyGO的应援色,比如主视觉图里,MyGO的标题旁边有一个指南针,在不影响论文本身表述的情况下,加入了一些小小的细节。
论文写了之后投稿到了一个多媒体领域的顶会,然后挂到了预印本网站上,代码和数据也公开在了Github中。起初我觉得,虽然这个文章确实做出了一点新东西,但毕竟是小众领域小众方向,应该也不会有特别多的人注意到这件事。
意外“出圈”¶
没想到文章放出去一天就被一些公众号和小红书笔记转载了,还配了一些不知道是人写的还是机翻的阅读笔记和论文介绍,然后这些推文就逐渐传开了,不过传开的方向有些诡异,不是在科研的圈子里传播,而是在MyGO相关的社区里传开了,包括贴吧、小红书、QQ空间还有NGA,Github的代码仓库也陆续来了不少人留下评论,比如什么还在GO!!!!!,我是来结束这一切的,还有做一辈子科研等等等等。
本意是坏的,让2024年的互联网执行得更坏了
对此实际上我还是有一定风险预期的,只不过我的导师可能不太理解,那天就突然来问我,怎么这么多人在代码仓库里留评论,是怎么回事,在我尴尬地解释了一通之后导师似乎恍然大悟:哦,原来是你们二次元。
失与得¶
在这做这个工作的期间也有一些小插曲,一是抱着试试心态投的老方向文章意外地中了,突然它就变成了我人生中第一篇顶会论文;二是转投的没头脑和不高兴依然不容乐观,没头脑是总体分数偏低,而不高兴则是有人恶意给了一个低分,撤稿了没头脑之后花几天时间疯狂写了一波不高兴的审稿意见回复,期待能打赢复活赛。
三是论文快写完准备投稿的时候收到了最终通知,说今年入学的博士名额确实没有了,当时郁闷了好一阵,在一边郁闷的过程中一边写MyGO的论文主题,最终还是赶在截稿日之前完成了投稿。虽然早就知道结果大概会是这样,但将不确定性留到了下半年的最后,还是非常焦虑。
四是因为预感到这个学期可能还没法转博,下个学期能不能成也是个未知数,所以为了留条后路,一边做实验写文章一边开始投递暑期实习,陆陆续续面试了大概十家公司,拿到了几个offer,这个过程在我上半年更新的另一篇博客里有更详细的记录。
总的来说,不管读不读博,上岸也好,沉溺也罢,生活总得继续,所以还是多花了不少精力做了多几手准备。上面那一连串的事情大约在四月底差不多就都结束了,坏消息是这段时间确实忙的晕头转向,一边一边一边一边,好消息是忙碌也让人变得钝感,很多事情也没时间用忧伤的四十五度角仰望天空了。总是假装自己很有规划,似乎尝试过走出很多条路,但实际上却是一个迷路的人到处乱窜,假装自己正走在朝着目标前进。
值得一提的是劳动节放假那几天去了一趟上海,看了一场音律联觉,算是不错的放松,遗憾的是行程比较特种兵,当天早上去当天晚上回,多亏了杭州作为南直隶松江府的后花园交通还算便利。
其三、熙熙攘攘,上班的路上¶
00后整顿职场之我同事在哪¶
接了offer之后打算跑出去实习一阵子,所以停下了手头的各项工作,跑到了一家公司实习,不过由于外面租房贵且烦,所以还是住在学校宿舍里,每天花一个多小时的时间来回通勤,一趟单程需要坐十几站地铁外加十分钟步行。这个时间段的杭州往往在炕州和沆州之间切换,不是暴晒就是暴雨,无疑给通勤增加了很多不必要的困难。每天的上下班时间都是杭州的通勤高峰期,马路上和地铁站里都是熙熙攘攘的上班族,那条路上人山人海,而所有人又似乎在人海里独自穿行。
来报到的第一天才发现,原来实习的部门的主要团队都在京城,只有我选择了杭州办公地,这就导致来报到的第一天甚至没有来接我去工位的人,最后主管叫了一个隔壁部门在杭州办公的同事才带我找到了工位。后面的三个月时间就是日常琐碎的各种工作,招聘的时候写明的工作内容是做大语言模型的训练,实际的工作内容无非就是改代码、洗数据和提交训练任务,剩下的事情都可以交给公司的基础设施。工作没什么难度,公司管三餐和下午茶白吃白喝,就这么一天天地混了好几个月。
除了混吃混喝和天天摸鱼以外没看出来整顿了什么
然而看起来风平浪静的几个月期间其实也发生了不少事。
别样的复活大赛¶
第一件事发生在入职之前,不高兴在第二次投稿中打赢了复活赛,中了今年的ACL,虽然因为其中一个审稿意见全是诋毁,导致最后是个Findings,但好歹成功推销出去了,给这个项目陆陆续续干了两年半的杂活,没想到最后一年的工作内容还能发个论文,也算是这两年在微信群里没白跟甲方对线。受到消息的时候开心了好几天,毕竟是ACL,还是在新方向上探索的第一篇文章,突然就理解了范进中举时候的心情。
托谁的福¶
第二件事大约从入职后的半个月开始,那时候没能找到机会转博使我的内容充满了不安定感,不安则生变,于是当时就打算联系一下别的出路,想着申请一个外面的博士去读其实也可行。于是就开始先备战托福。不过要求也不高,凑合着能过线就行,剩下的事情就得靠英语以外的东西来解决了。
向已经在美国百特丹斯(ByteDance)公司工作的室友咨询一番之后了解到可能托福简单一点,于是就下单了一个月之后的一场托福考试。不得不说,资本主义的考试费是真的贵。另外还买了一本官方的备考资料,再加上网上到处搜集来的杂七杂八的题目和材料,凑合着开始备考。
虽然平时经常在写论文,但毕竟从高三之后再也没有系统地学过英语,刚上大学时候的一年英语课基本等于没学,在昏昏欲睡的课堂中收获了整个本科期间最低的成绩,所以当我再次面对各种英语考试题型已经有些相形见绌。
更糟糕的是托福还有口语,这对一个从小学习哑巴英语的人来说简直就是灾难。听力也不容易,刚开始练听力的时候,我感觉录音里的男男女女不是外国人,而是外星人,他们说的话我一句都听不清。阅读和写作反而是最容易的,毕竟从小考到大都是这样的玩意。另一个新感想就是自己的词汇量很匮乏,考托福毕竟不是看论文,毕竟很多论文可能是英语水平半斤八两的中国学生写的。于是还得专门抽点时间出来背新单词。
就这样,这一个月的备考时间变成了早上上班的时候在地铁上看几眼单词,晚上下班回来再刷一个小时真题,趁室友还没回来的时候练几句口语,逐渐过拟合了托福考试的各种题型。备考的时候因为对阅读和写作比较有把握所以练的比较少,主要的精力都花在了联系听力和口语上,时间一到就硬着头皮去了考试院考试。
不过这种投机取巧的备考方式在正式考试的时候有点翻车了,正式考试的时候偶遇超难阅读题,拼尽全力无法战胜,听力和口语倒是因为练得多拿到了中规中矩的分数,最后分数出来的时候勉强过了最低标准,但阅读分数奇差无比。不知道托了谁的福,在开局阅读翻车的情况下,靠写作分数还行总算还是凑够了申请港校和坡县的最低标准要求。
这个,不需要了¶
第三件事大概在七月份的中旬,之前投稿的MyGO开奖了,发现MyGO拿到了一个比较边缘的分数,最后没给过,反而是第三次转投的没头脑,获得了很高的分数中稿了,这两篇文章都投稿到了同一个会ACMMM,作为多媒体领域的顶会,MM拒绝了正经的多媒体企划MyGO,反而接收了另一篇不怎么多媒体的文章。
从我自己的评价来看,MyGO是对已经成熟的领域的全新改变,而没头脑则是在新方向里挖的一个不成熟的坑,无论是完成度还是综合质量,MyGO都要高于“没头脑”,结果MyGO反而是不被需要的那个,碰碰运气第三次转投的文章反而中了顶会,不得不说也是一种反向筛选。
尽管我对这篇文章有很多不满意的地方,但是它在挂出预印本之后的一年多时间里被引用了50次,相比于其他几篇文章来说高的有点离谱。这篇不太满意的,留下了诸多遗憾的新方向的探索文章反而在事实上成为了自己的代表作,而老方向的几篇工作虽然也有发表,也有少量人引用,终究没有引起什么关注(MyGO这样的关注当然是另一种意义上的关注),可能这就是流量时代的科研。
在经历了初次的失败之后,MyGO经过一番休整,走上了它的第二次投稿之路。
跑路竞速赛¶
第四件事发生在七月底八月初,刚入职的时候,主管给指派了部门里的一个老员工作为我的直接mentor,由他来给我布置和指导具体的工作内容,不过他们都在北京,想跟他们交流只能通过视频会议。
有一天他突然神秘兮兮地拉了个,跟我说,今年转正要求比较高,HR那边招聘的政策发生了一点变化,此处省略巴拉巴拉的一大堆话。大致的意思就是,今年招聘人员名额砍了,因为计算资源就这么多,所以计划把原本招10个人的预算拿来招5个人,但是每个人的工资大幅度上涨,以此来吸引能力更强的人才做出更多的成果。
讲了一大堆,我听下来其实就一句话,如果不想继续卷的话,可以准备实习一段时间就走了。考虑到我现在的地位非常边缘,组里就我一个人在杭州这边的办公区上班,正式转正之后大概率是要去北京总部的,思考了一下之后我提出把手头的工作做完,混到九月份就跑路(此时才七月底),两边就这么达成了默契。
其实关于实习的这段经历,还有很多细节没法在这篇博客中一一细说,这段实习给的总的感受是,部门里的效益似乎不够好,有点摇摇欲坠,我混在这里实习的三个月时间里,陆陆续续有好多人事上的变动,大概这就是互联网产业的常态吧。做的东西本身似乎也是些屎上雕花的玩意,很难说真的有什么经济效益。
令我没有想到的是,这次聊完过了没多久,上班的时候突然听说我的mentor自己跑路了,走公司内部转岗去了其他部门。我自己还赖着没跑路,mentor倒是抢先一步自己先跑路了,大概这就是公司入职第一天培训的时候说的字节范,万事争先,就连跑路,也需竞速,切不可落后于别人。
实习了三个月零三天之后,九月份又回到了学校。
其四、做甚分享¶
回到学校之后又开始了之前一样的生活,一边紧张地等待组内明年入学的博士名额,一边也投了一些秋招,物色了一些港校开始发邮件给教授套词。
大约九月中旬的时候导师郑重其事地找到我,跟我说有名额了。我突然感觉到如释重负,等了整整一年终于等来了这句承诺。
Who Go 沪GO¶
早就听说MyGO要来上海开演唱会,抢票的那天和几个老同学正在吃饭,我在点菜的时候就说,帮我一起抢票,抢到了这顿我请,结果没想到真的抢到了一张,爽快地请了这顿饭,也买好了往返的高铁票,依然是当天去当天回。
出发的那天很早就醒了,收拾好东西直接就奔杭州东站去,很快到达了宇宙的中心上海虹桥站,然后换乘一路地铁到达了演唱会的场地虹馆。原本行程挺顺利的,没想到这时候开始迷路了,在一个偌大的场馆里来回打转,怎么也找不到门票上写的那个入口。迷路了好一阵之后经高人指点,发现原来演唱会的入口在顶层,而我一直在底下打转,没找到那个上楼的电梯口,怪不得也一直没见到几个活人。
值得一提的是上海的地铁有精确到秒的倒计时,感觉情绪价值这块完全拿捏了。
场馆外人山人海,排场贩的,拍照集邮的,也有送小礼品的和各路逆天整活的。这时候离开场还有五六个小时,先找了个地方随便吃点午饭,在虹馆周边逛了一大圈,和学校邦群里的群友碰了个面,随便吃了点晚饭填填肚子又走回了虹馆。
关于演唱会的很多细节似乎记不清了,只记得我的座位虽然离舞台略远,但是在正中间,视角非常好。入场的时候广播一直在强调演唱会期间不许站起来看,结果第一首歌的前奏一响,立刻就全体起立了,打call应援声此起彼伏。来之前我觉得我不是什么声优痴,来之后感觉确实有点陷进去了。可惜美好的时光总是短暂,看完演唱会之后又急忙赶路回了杭州,到寝室的时候刚好是十二点,新的一天在一觉醒来之后又开始了。
何故做分享¶
九月底的时候学校开始评奖学金,填了一堆材料外加一通答辩之后拿到了今年的国家奖学金,要说起来,上大学之后六年以来还是第一次,全靠去年这一学年运气不错,中了几篇鸟文章把科研分拉满了。
答辩的时候被其他候选人的成果给吓到的,家长口中的一边一边一边一边真的在这群人身上实现了,他们的能力指标雷达图仿佛是圆形的。
硕士的国奖有两万块钱,属实是一笔巨款,根据我按了一通计算器得到的计算结果,只要从嘉靖三年开始不吃不喝并且年年都拿国奖的话,就可以在公元二〇二四年的杭州买下一处房产。当然,从嘉靖年间活到现在有一定的难度,不过那也没什么办法,毕竟没有家境的话,除了从嘉靖年间开始攒钱以外似乎也没有别的选择。
拿到国奖之后某天钉钉上被一个学弟私戳,自称是学院研究生会的,问我能不能参加国奖面对面经验分享。虽然没什么经验,但我还是接下了这个任务,不过最后也没一板一眼地讲如何从一个idea开始做出一篇完成的工作,这些东西对于刚入学的新同学可能还有些遥远,取而代之的是分享了一些与技术和技巧无关的东西,以及自己一路走来的心路历程。
有监督学习:导师有指导,自己跟着搞。虽然做项目,但是成果好。
无监督学习:导师不指导,自己随便搞。项目不用做,出路自己找。
半监督学习:导师不指导,科研自己搞。一直催项目,忙完毕业了。
自监督学习:导师不指导,自己看着搞。摸索去试错,中稿运气好。
对抗式学习:导师有指导,但我不想搞。等我想动手,导师早气跑。
提问环节有同学问:你觉得怎么样的科研才是高质量的科研?我说,我可能不知道什么是高质量的科研,但我知道什么是低质量的科研,大概就是像我这样的。我说,我觉得挖出一个新坑给别人带来饭碗的,可能就是好工作,填满了一个坑,还盖上盖子的让别人没饭吃的,就容易被评价为不好的工作。同学又问到,可是我刚入门,连填坑都不会填,该怎么办呢?我说,这个简单,你从别人的坑里借一个井盖来给自己填上就行。
其五、未来仍漫长¶
十月份的时候转博开始报名了,花了几天时间填好了系统,准备好了各种纸质材料交到了招生办,又开始了漫长的等待,十月底交上去了各种材料,一个月之后的十一月底通知有个复试面试,又在十二月初完成了复试。
准备的过程中也在慢悠悠地做着新的课题(虽然投稿了但总觉得有点烂尾),每天差不多都是一边做做科研以及应付实验室里的各种活,一边互联网冲浪,上半年的时候因为未来一片迷茫,多少有些心绪不宁,精神也总是处于一个紧张的状态,到了九月份之后明显地出现了好转,其实之前关于读博还是工作也有过很多思想争论,看着老朋友们参加秋招找到了满意的工作,也曾一度对自己的选择产生过怀疑,不过最后还是选择了这条几年前从来没想过的路。
十二月份还有一件惊喜就是MyGO也中稿了,吸取了第一次投稿的教训,改了不少地方,包括改了标题防止被追杀,但是方法的名字依然叫MyGO,第二次投稿之后发现分数还行,但是有个不太懂这个方向的人在乱审打低分,出结果前前一段时间刷小红书也听各路知情人士说今年总体的录取分数线比较高,当时就感觉MyGO可能大概率要凉了,甚至已经改好了模板准备被拒之后转投了,最后收到消息还是中了,算是十分惊喜的一件事。从有想法开始到收到中稿邮件,差不多刚好十个月的时间。
写到这里花了差不多两天时间,一直在写写写,虽然记录得像是啰嗦的流水账,但回过头一看还是漏了不少事情和细节,不过也来不及修改了,就这样挂到博客上吧。
2024年,确实是忙碌又充实的一整年,确实有不少收获,对很多事情都有了新的想法和新的看法,那么代价是什么呢?