送交者: bluesea 于 2013-01-21, 10:09:06:
这些仅仅是被动式监听,就是说他们实现了网络协议底层上的镜像,可以获得机器上所有进出流量数据而已。
我现在做的,要比这个复杂得多,仅仅还原HTTP其实就要花很多时间去做。但是这仅仅是相当小的一块。监听也仅仅是一部份而已。
我们试图通过监听,建立其用户最基本信息,比如说姓名,或者用户名,或者电话。根据这些信息,我们再做监听和网络爬虫,竭力组成关于这个人的一串信息,比如整套的个人信息,网络行为。
为什么15年以前不太可能有。15年前广泛的网络行为还没有建立。所以即便有采样的数据也没有太大的意义。原因是上网的还比较少,很难采集数据。比如facebook linkedin 等等这些应用都没有。普通论坛的ID 不值钱。
另外就是偶尔采集到一些信息,因为所占人群比例非常小。也没有意义。
再另外,相关的商业环境还远没充分。数据价值因此也不大。
还有呢,无法延伸到手机,15年前木有智能手机。相关数据收集价值不大。推送信息也不好做。
所以。