我看到这篇文章
美国芝加哥警方使用社交搜索工具阻止暴力犯罪
[导读]为了打击团伙暴力犯罪,芝加哥警察局正在利用网络分析追踪那些活跃的帮派团伙成员,并向他们发出警告信息。 据《Governing》杂志报道,芝加哥警察局(Chicago Police Department ,以下简称CPD)正在创建一个以网络分析为基础的社交媒体,以建立芝加哥14,000个最活跃的帮派团伙成员之间的关系地图。这个地图将反映出这些成员因帮派暴力杀人或被杀的可能性。正如《Governing》杂志指出的那样: CPD发现了一些惊人的事情:与城市“热点(事件)”相比, 城市中的“热点人物”更多。
就是犯事的人,比反的事容易找 这个其实他们是怎么做到的呢?
首先。。。。你要有女朋友——不是啦 是可以通过热点事件以及事件中帮派的co-occurance pattern 有些词互相搭配是有规律的
你不会天天用一些黑话说一些很正常的家事
所以所谓热点事件就是 最近谁谁谁 被干掉了什么的就找吧 但我们有遇到了另外一个问题,其实所谓热点。不是我们一早就知道的
我鬼知道那帮黑社会平时干了些什么
所以我们不知道他们的黑话,但我们知道他们会讲黑话,而且重复的讲
所以你对比所有人的语言,比较重复的就是有可能是黑话,而且是黑社会 但不是重复的就一定是黑话,有可能是果壳啊 我们不是讲很多
那么怎么弄 一开始尽可能的弄,越多越好,把模型先建起来,之后才选择适合的参数
就是果壳er 不会和黑社会住一起,所以地理的因素就不一样 但选择参数很繁杂,那怎么办,简单弄个算法
这就是
Tibshirani(1996)提出了Lasso(The Least Absolute Shrinkage and Selectionator operator)算法。
加上图用Graphical LASSO来model帮派之间的关系 把应去的去掉
大概就是一张那帮坏人的地图 当然啦,我不想上公式,LASSO 其实是令你看的懂那是什么东东
不然,看不懂的图就是垃圾
而且其实不太准,但总比没有好 ————————————
技术是我自己经验猜的,鬼知道他们详细怎么做的
大概差不多
|