神马?关于大数据黑客的吐槽

群水饶城 2013-07-22 149987人围观 ,发现 10 个不明物体 其他

现在经常听到什么大数据黑客,个人觉得有必要讨论讨论,我们这里简单探讨几个简单的问题,什么是大数据?大数据对黑阔而言?安全行业的大数据?


1.什么是大数据,不是大了的数据就是大数据,整天看到小哥门说什么大数据黑阔,你有13亿不代表你就是大数据,你只是有个这么大的数据库而已.你查查表觉得就是大数据的话,那我和小伙伴真的震惊了.

大数据一个核心的特征是预测,比如墙外公司google可以通过用户的搜索进行数据分析挖掘去预测一些社会现象的现象,甚至预测金融和国家的方向;或者一个典型的amazon通过对大量的数据进行分析去判断用户的习惯推荐相关性产品等等,不是现在什么阎王之眼就是大数据,个人感觉现在完全不到级别啊,性质也不是很相同,硬要炒这个概念的话,那也真是不知道杂说了。

2.大数据对黑阔而言呢?黑阔完全控制大量集群系统是可行的,但是长期控制和应用可行性较低,如果你学kxlzx去运行破解啥的,那就趁早洗洗睡吧。大数据的目的是应用,我们其实可以通过一定的数据注入,去完全去影响企业对未来的预测,因为数据量很大,缺乏相关性,分析不再基于相关性,那通过数据的注入造成的中毒现象完全是可以去在一定程度上影响企业的未来,这个只是一个比较现实可行的。

从技术角度,其实你能获取的顶多是足够多的权限,有偶把那用。所以大数据的安全攻击应该从技术角度逐步向业务角度转变。当然,不是让大家去影响未来。:)

3.大数据对安全而言呢?确实,对大量数据的保存,我们可以进行更多的挖掘和研究,得到更多的信息,但是安全可以预测吗?这个是我们要思考的一个问题,在某个层面讲,我们可以通过分析挖掘看到趋势,但是对单个的企业而言,他如何愿意花足够的成本去建立一个完整的大数据安全分析系统,而且做的工作现在看,可能更多的就是日志的挖掘。当然不排除未来更多新的应用。但至少现在看,其本身性质和安全相比有很多不融合性。

以上吐槽,只是看不下大家整天大数据大数据的,但是大数据确实相信会给未来带来很多改变,但安全上,保持谨慎态度。

这些评论亮了

  • livers 回复
    首先我要说明一点 可能作者对大数据了解的还不够深入。目前玩大数据玩的多无非几家巨头公司,google,baidu,亚马逊。对于大数据挖掘目前比较比较流行火热的方法是 deeplearning.即使国外从这个理论出现到现在很长时间,而实际应用也极为狭窄。目前应用广泛是图片识别和语音识别,比较典型的例子就是google和百度的图片搜索的识别。google 的图片识别算法已经公开了一些,是用的卷积向量进行识别,极度复杂。而也只能针对图片语音这种有明显特征的样本数据。而时下火热的hodoop框架,以及各种模型工具spss,sas 之类也是局限在一些相似度比较高的样本中。而大部分基于hodoop应用所做的只是借助其并行的运算,利用的还是之前的类似查询语句,要处理之间并行运算结果相互影响也是很麻烦的。目前很多愿景还只在实验室阶段,并不能实际使用。像撒旦之眼之类可能看起来很低级,但也是耗费了大量精力,不是你想的那么简单。大数据更多要依赖硬件,要成百上千的服务器,企业可以宣传,个人的话。。。毕竟这不是个人玩的起的。
    )23( 亮了
  • xt9 回复
    大数据对于安全的帮助你可以这样看:
    一个人躲掉一个摄像头杀人是可能的,躲掉所有摄像头则就必须是专业杀手了。
    甚至于买刀(枪)不被人知道,要确保自己没有任何证物出现在凶案现场,更是难上加难。
    以上所有的证据都可以数据化,以前的对抗,你躲掉任意一条可能就躲开安全软件或防护了,而今后你需要躲开所有的。
    )10( 亮了
发表评论

已有 10 条评论

  • livers  2013-07-22 回复 1楼

    首先我要说明一点 可能作者对大数据了解的还不够深入。目前玩大数据玩的多无非几家巨头公司,google,baidu,亚马逊。对于大数据挖掘目前比较比较流行火热的方法是 deeplearning.即使国外从这个理论出现到现在很长时间,而实际应用也极为狭窄。目前应用广泛是图片识别和语音识别,比较典型的例子就是google和百度的图片搜索的识别。google 的图片识别算法已经公开了一些,是用的卷积向量进行识别,极度复杂。而也只能针对图片语音这种有明显特征的样本数据。而时下火热的hodoop框架,以及各种模型工具spss,sas 之类也是局限在一些相似度比较高的样本中。而大部分基于hodoop应用所做的只是借助其并行的运算,利用的还是之前的类似查询语句,要处理之间并行运算结果相互影响也是很麻烦的。目前很多愿景还只在实验室阶段,并不能实际使用。像撒旦之眼之类可能看起来很低级,但也是耗费了大量精力,不是你想的那么简单。大数据更多要依赖硬件,要成百上千的服务器,企业可以宣传,个人的话。。。毕竟这不是个人玩的起的。

  • fake  2013-07-22 回复 2楼

    我觉得群水说的有点道理,别整天忽悠大数据概念这个东西…

  • xt9  2013-07-22 回复 4楼

    大数据对于安全的帮助你可以这样看:
    一个人躲掉一个摄像头杀人是可能的,躲掉所有摄像头则就必须是专业杀手了。
    甚至于买刀(枪)不被人知道,要确保自己没有任何证物出现在凶案现场,更是难上加难。

    以上所有的证据都可以数据化,以前的对抗,你躲掉任意一条可能就躲开安全软件或防护了,而今后你需要躲开所有的。

  • sasi  2013-07-22 回复 6楼

    应该和这两个概念聚类分析和数据挖掘有关系

    北京有个亿赞普在全国已部署了近万套服务器和存储设备,遍布300余个城市,覆盖了中国90%地区的互联网云计算平台。这一套服务器和存储设备的布设,都与网络运营商的机房毗邻。发言人说他们:“我们不采集用户名字、住址、电话号码、上网IP等个人信息,这对我们来说是负担。”

  • 陈可逆  2013-07-23 回复 7楼

    我坚信大数据的巨大能量,也因此坚信大数据时代无可置疑的到来。我也很乐
    观地相信未来人们的生活会因此而大大改进。
    大数据时代一定会到来
    我们现在处于信息时代,这是大家都能接受的,但是如果说人类一直处于信息时代,这么
    想的人就少了。纵观人类的文明史,就是我们不断将客观世界数据化的过程。人类的文明
    程度越高,我们赋予某物品或事件的信息量就越大。一块石头对于原始人最多只是一块石
    斧或石锤,对于中世纪的人来说还是建造房屋和城墙的材料,而对于现代人来说还可以是
    铁矿石或者二氧化硅。从这种意义上来说,世间万物都是由一个个无穷大的数据集合组成
    的。人们不断地建立一些手段方法从这些事物中找出符合规范的信息。比如,电子商务实
    际上是卖的是附着于商品上的价格信息、物理化学信息、口碑信息等。更为重要的一点是
    ,除却A事物以外的其他B事物、C事物都会直接或间接地赋予A事物以不同的信息。这很容
    易理解,比如北京这一概念就赋予了上海这一概念很多额外的信息,而东京这一概念由赋
    予了两者更多不同的额外信息。
    能被人们认知到的信息的数量并不是线性增加,而更接近于指数增加。事物信息量的增加
    和人们对它的利用能力也不是同比例增长的,而是相互促进的正反馈模式。计算机、互联
    网、社交网络等技术的出现,给事物填注了海量的信息,其用时之短前所未见。对事物这
    些海量关系之间的利用,不啻于人类使用火以后对自然界各种食物的重新认识。两者的共
    同点是:都给人类带来了确实的好处。在清晰的现实利益的推动下,大数据普及和推广所
    面临的那些技术困难都将一一迎刃而解。
    被重新定义的人
    由大数据带来的显而易见地好处想比,深谋远虑的现代人类更关心自己是否会被大数据挤
    到了天涯海角。可以说,《终结者》也好,《黑客帝国》也好,都表现了人类对机器与技
    术的恐惧。只是人们在恐惧的同时应该首先搞清楚我们怎么定义人,狭隘点讲,怎么定义
    自由意志。
    存在两种哲学定义,一种认为人的自由意志是一种独立的、绝对的实体,一种认为人的自
    由意志是一个系统,一个组合体。可想而知,如果抱有前者的观点,那么随着技术和科技
    越来越进步,那个独立绝对实体的神秘面纱将被一层层揭开,再也没有神秘可言,那时便
    是人类末日了。但是人类会被数据淹没,被技术代替吗?不会。因为人的定义是随着时代
    发展而不断进化的。人始终浮于数据之上,由数据所支撑,所定义。
    在牛顿力学诞生之初,很多人曾认为给定了初始状态和物理定律,可以推断一切事物以后
    的一切活动,也就是说世间一切都是注定了的,即便有些事物无法预测,也只是由于暂时
    的技术限制了计算量。这也就否认了所谓的自由意志。但是正如《三体》一书中所提到的
    那个简单的三体问题,实际上是无解的。但是世间万物并没有被“注定”,自由意志存在
    与否仍旧是哲学范畴而无法进入科学领域。牛顿后半生去化全部精力去寻找那所谓的“第
    一推动力”,即上帝的存在,也成了徒劳的工作。
    在我看来,大数据时代的立论依据全在于由样本分析到全体分析这种令人感到绝望和
    窒息的无差别暴力攻击手段。

  • 直觉动物  (5级)  2013-07-23 回复 8楼

    确实等于没说,提出一堆问题就扔下不管了。还有,大数据的概念其实大家一直没弄清楚,大数据的意义也需要正视。大数据起源于生物科学等尖端科学,比如人类基因组研究就会用到“大数据”。因此,人们是有利用大数据的经验的,现在的问题是推广和发散,还要跳出思维定势思考大数据给我们带来的新的变化。这是人类面临的挑战和机遇!

  • crack  (1级)  2013-07-23 回复 9楼

    个人理解,大数据分析是指基础数据上跑数据分析模型,分析的结果作为直接产品供数据拥有者使用,作者提到的数据注入或者数据缺失确实应该是大数据安全的一个重要因素,其主要实现了对数据分析模型输入数据的控制,但如何做到悄无声息的控制需要考虑,一个好的数据模型本身应该是有数据纠错的能力。

取消
Loading...
css.php