档案馆《数据的美》:概括描述了20单数据挖掘、数据可视化、云存储同其余数处理相关项目

档案馆《数据的美》:概括描述了20单数据挖掘、数据可视化、云存储同其余数处理相关项目

当时按照开相对来说还算比较新,是自英文版翻译过来的。英文版2009年问世。中文版2010年10月出版。由20首相互独立的稿子做。每篇讲一个多少处理相关的档次。不关乎具体的技术细节,仅仅是包说明原理、思路、过程、结果。

整体来说,阅读起来有些生硬。感觉作者基本还了解英文版的意思,不过有点地方中文表达上无足够通顺。这在IT业的翻题中就算对的结合了,强过中文过关但是非知情技术之动静。

里面讲数量档案馆可视化的稿子有几首。还都比有趣。比如第六节“照片档案的地理的美”,说之是英国之一个称作“Geograph”的档次,收集了汪洋底英国的照片跟普通用户对照片的竹签,作者分析这些标签,并且为此图形化的方式把广大分析结果表现出来;第11章“都市数据可视化”,讲的是拿警方的违纪有的数量和地图结合起来,预测犯罪有的地方及种类从而提前预防;第12章“Sense.us的规划”讲为可视化手段分析美国150年来说的丁数,得出许多妙不可言的结论;第17章节“数据解析:探索形形色色的社会定型”说之凡因此图形化方法分析一个网站的大量用户相互之间的评价;第19章“美丽的政治数据”同样采用可视化手段分析选举相关数据。

第4段“PNUTShell中之出口存储设计”,说的凡雅虎的一个云存储的类别PNUTShell的筹划思路和优缺点。这个类别对的采用关键是应酬方面的施用,数据一致性要求未高,可用性、扩展性要求老高。因此即便针对一致性做了部分献身,满足于大的可用性和扩展性。数据如果最终随操作顺序执行了系的操作,最终一致即足以了。每一样漫长数还记录了本号,好掌握自己行到非常步骤了。每一样条记下还待记录自己是无是主备份。写操作而先行勾勒主备份然后日渐联合到外数据库及。如果系统发现用户比累地勾勒多少只是主备份所在服务器的物理距离与用户的大体距离较远,就机关将主备客记录转移至距用户更近的服务器上。如果主备份损坏,系统吧会见从剩下的数量中精选最适于的相同长条做主备份。

第9节“探寻Deep
Web”说之是如何吃追寻引擎自动搜索Form表单。Form表单可以产生管根本个结合,这首文章让闹一部分基本思路来为找引擎判断哪些错过挑选下拉列表或者去填文本框,目标是故尽量少的操作步骤尽量多地得到form表单后面的数据库被的内容。

admin

网站地图xml地图