用爬虫分析了全网年夜饭菜谱后 找到了最有年味 2019-02-28 19:59

  但不同地区、不同的人对吃也有千百种看法。千滋百味是中国菜的特色,但中国的“年味”到底是怎样的?

  在咽了无数次口水后,文摘菌选取了几个美食网站,获取了所有带有“年夜饭”这一关键词的菜谱。在这些网站上,爬下的菜谱除了系统推荐,相当大的一部分内容是活生生的用户大厨们主动上传。

  简单来说,爬取这些“年夜饭”菜谱的过程,就像走进了千万家的除夕夜一样。文摘菌看着这一桌桌“年夜饭”备好出锅,关于中国“年味”的印象也就大致成形了。

  首先,当然是写爬虫,为了保证年夜饭分析的多样性,文摘菌踩点挑选了几个常用的美食网站:豆果美食、天天美食、美食天下、香哈网、心食谱等等,爬下了相关数据。

  由于手比较生,没实现全自动化,采用的是简单粗暴地按页爬方式。主要锁定了几个维度:菜名、用料、食材+数量搭配、其他(包含口味工艺耗时)、制作步骤、Tips、url。

  因为数据量不多,所以这一次直接存在了txt文件里面,说实话,暂时用不到MySQL、Hadoop一类的东西了。

  可以看得出,鸡肉是除夕餐桌上不可撼动的存在,第二名猪肉的份额也不错,达到了18%,其次是鱼肉和虾。

  似乎在多数中国人的印象里,猪肉才是除夕餐桌上的霸王,毕竟是猪年嘛。但是,就算加上其他类的中的排骨,五花肉等等,猪肉也打不赢鸡肉。

  第一名,萝卜,小人参的称呼不是白得的。白萝卜、胡萝卜,好存放又百搭,必须是冬天中国人餐桌上常见菜式,而且领先优势明显,比第二名玉米高了13个百分点。

  通过对调味料的聚类分析,我们可以看出,最受欢迎的调味品还是盐。其次是葱,姜。中国人对于提“味”的执念真的很深了。

  中国文化的“中庸之道”在年夜饭的菜谱中也体现的淋漓尽致。在描述调味料用量的时候,“适量”以超出第二名7倍的提及量,妥妥儿的排名第一。

  文摘菌统计发现,年夜饭菜谱里接近20%的菜,都是用炒的方式烹饪的,而炒相对于炖和煮来说,所用的时间还是比较少的。

  排名第二的分别是拌和煮。嗯,这个统计结果也还算合理,毕竟一桌丰盛的年夜饭,怎么能少的了凉拌黄瓜、拌土豆丝、拌三丝这些凉菜。

  中国菜的技艺复杂,煎炒炸蒸焖煮烧,“千奇百怪”。还有许多叫不上名字的做法已经占比达到了16%。

  嫩鸡半只,适量胡萝卜,香菜和葱和蒜,生姜以及适量的酱油,盐和醋。然后少量的八角,花椒,桂皮。

  鸡冼净切块,加料酒腌制备用。将萝卜切好,锅中放油,倒入腌好的鸡块,加八角,花椒,桂皮炒至鸡肉变色后,有香味出来时,加酱油调色,盛出备用。