这个网站,你可以搜索文章,然后点击下载。
-hub.tw/
或者sci-hub这个网站,输入DOI号或者文章原链接,便可下载。
①2003年,Google发布Google File System论文,这是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能。
②2004年公布的 MapReduce论文,论文描述了大数据的分布式计算,主要思想是将任务分解然后在多台处理能力较弱的计算节点中同时处理,然后将结果合并从而完成大数据处理。
③2006年的Bigtable,启发了无数的NoSQL数据库,比如:Cassandra、HBase等等。