2、客观记录尽可能多和真实的数据
比如淘宝系统,或者阳光太仓人才网在开发设计系统时,用户什么时候下单,求职者什么时候应聘,数据记录中可以精确到日,也能精确到秒,可以保留ip地址信息,也能不保留。但是,如今的信息技术,让记录更加精确的数据的代价变得很小,有些数据,虽然以目前的眼光或者以割裂的方式来看价值不大,但是还是应该尽可能去记录,也就是说,在代价不大的情况下“记录世界”越详细越好,越有利于大数据的应用。
3、尽可能的融合更多的数据
将地理位置和购物记录融合起来,能分析出不同地区的人的购物癖好,那么融合再融合入职位和收入信息呢?是不是可以又可以推导出不同月薪层次的人的爱好和购物价值观?
4、大数据挖掘的信息要发挥指导作用
孙波打喷嚏满100,就会火山喷发,这个理论在每次孙波打90个喷嚏就疏散居民的时候发挥了指导作用,产生了价值。同样,分析出上海人喜欢买鲜肉月饼,就能对筹建月饼厂,优化猪肉物流配送等方面产生指导作用。只有发挥指导作用的大数据才是有价值的,才是我说的大数据。