百度作为全球最大的中文搜索引擎公司,提供基于搜索引擎的各种产品,几乎覆盖了中文网络世界中所有的搜索需求,因此,百度对海量数据处理的要求是比较高的, 要在线下对数据进行分析,还要在规定的时间内处理完并反馈到平台上。百度在互联网领域的平台需求要通过性能较好的云平台进行处理了,Hadoop就是很好 的选择。在百度,Hadoop主要应用于以下几个方面:
标签归档: 百度
国内各大网盘开启分享审查
国内各大TB级网盘开启分享链接审查,首先是发现腾讯的微云网盘开始审查分享链接,然后转战百度云盘,发现百度也对部分的分享链接进行了审查。之前为了节省网站空间,将比较大的文档直接放在了网盘上面,在文章中给出下载链接,这样结合起来使用非常方便。
早先就预料到“TB级,终身免费”这样的模式不会长久,果然,各大互联网商该功能推出还不到1年的时间,就收到如此致命一击,没有了分享功能,网盘的流量会大减。网盘的模式都是希望提供一个平台,来推动用户成为内容的生产者,给网站带来流量,不能分享,也就意味这个平台存在的意义不大了。
[分享]百度分布式数据库
很老的视频了,感觉讲得不错,百度09年都已经SSD了,我们却还在挣扎着怎样精简流程来节省元数据的访问。右边是视频中用于讲解的PPT。