- 特别简单,适合初学者
我们提到过,照片和视频分享平台是最容易实现追踪的,因为在这些平台上,用户倾向于过多地暴露自己以赢取关注。追踪者就可以利用这点。
不论是 Instagram、tumblr、还是抖音,都会比 Twitter 更多暴露目标人的可追踪线索。
社交媒体情报是一个致命的问题,因为直到目前为止都没有有效的法律可以保护用户。
但是禁止一切挖掘也是不现实的,因为调查记者、NGO组织、人权组织、公民社会、公民自治团体等等,都在使用这种方法获取信息。
我们介绍这些挖掘方法的用意是**技术民主化** —— 不让这一能力仅仅掌握在权势手中,而是分享给更多公民,已满足当权者不想要满足我们的东西。
关于如何针对社交媒体挖掘情报的方法我们此前介绍过很多了,您可以在下面回顾其中一些:
- 《调查记者如何从社交媒体上挖掘情报?》
- 《如何跨社交媒体平台追踪目标人?⚠️ 警告安全意识》
- 《如何在社交媒体上查找照片并按日期过滤:开源情报思考方式》
- 《别让社交媒体的自然模糊阻挡真相》
- 《揭露加密货币投资骗局:蜘蛛脚演示自动化开源情报调查》
- 《攻击者如何收集有关目标的情报?他们能了解你多少?》
- 以及更多 …… 在 “开源情报” 栏目中看到
真的有非常多,因为社交媒体情报是开源情报调查的重头戏。
对 Instagram 进行开源情报调查的工具也有很多,其中 Jake Creps 介绍的 InstaLoader 的确是很不错的一种。它在提供大量数据的同时又可以保持用户友好性。您可以在这里看到原文《InstaLoader – an OSINT Tool for Scraping Instagram Metadata》
InstaLoader 执行以下操作:
- 下载公开的和私有的个人信息、标签、用户故事、提要和保存的媒体;
- 下载每个帖子的评论、地理标记和标题;
- 自动检测个人资料名称是否有更改,并相应地重命名目标(也就是说目标即便改了名字也可以继续追踪);
- 允许您对过滤器以及存储下载的媒体的位置进行精细的自定义。
InstaLoader 可让您提取主题标签、用户发布的内容、提要、标题、和保存的媒体。这是进行社交媒体调查的基础。
👉这些信息很重要,追踪者和调查人员可以基于这些信息结合更多公开信息,以掌握目标人的几乎一切。
接下来,您可以下载每个帖子的评论和地理标记。每个帖子的评论都是线索,我们绝大多数人不会在网上无缘无故地给他人留评论对吧?于是对于追踪者来说,每一个评论都意味着 “下一条线索”。
👉 如果用户对个别评论有真实的反应,那么你就可以 “透视” 该个人资料,并重复 InstaLoader 流程以构建您的调查网络。
您可以潜在地从目标个人资料发现外部用户的活动。关于这一点,我们可以先讨论一个调查 Instagram 的独特问题。
关于 Instagram
对开源情报调查人员来说,Instagram 存在一个问题,例如 Twitter 之类的其他社交媒体则没有这样的问题 —— 即:您无法在其个人资料页面之外看到用户活动。
也就是说,您可以看到用户发布的内容,但是无法搜索他们与之交互的其他内容。显然,这在识别欺诈、僵尸网络帐户、潜在的人口贩子等目标的时候,就会出现问题。
没办法,它就是这么设计的。由于这个问题,您需要获取尽可能多的数据,才能编写有效的报告并得出合理的结论。
通过分析用户生成的内容下的评论来进行延展调查,是一种解决方案。
另一种方法是分析用户遵循的主题标签,以查找外部活动,该主题是公开可用的。一旦找到另一个与之交互的个人资料,就可以在该个人资料中搜索更多信息。
下面具体说说这个工具。
InstaLoader 设置
InstaLoader 是我使用过的最简单的工具之一。设置仅两个步骤:
$ pip3 install instaloader $ instaloader profile [profile ...]
仅此而已。由于它位于 PyPi 上,因此您可以使用 pip 进行安装,即可开始使用。这里没有更多要说的。这是该工具资料的链接。
用例
作为一般免责声明:您绝不应该出于恶意或令人毛骨悚然的原因使用 InstaLoader。
与大多数工具一样,好人和坏人都可以使用它来谋取私利。你别做坏人!
👉我们介绍所有工具都是帮助您防御的,最好的情况下是帮助没有民主经验的社会尝试民主化实践 —— 构建公民自己的调查社区,绝不是让您侵犯他人的。否则,您会被抓住,不开玩笑。
在更高的技术水平上,您可以使用 InstaLoader 提取数据、生成档案、进行链接分析等等。
这里是可以永久使用 Instaloader 的几种方法。
在有关尼日利亚王子骗局的文章中,就使用了 InstaLoader 来证明一个帐号不是他们所说的帐号。
因为该帐户现在已删除,所以这里简单介绍一下背景。
一个声称自己是尼日利亚埃米尔王子的账户说服人们购买加密货币,这是个骗局,该欺诈账户使用了该王子的照片,以便让人们信服。
第一步是确定他们冒充了哪个王子,然后证明他们是欺诈行为。
为此,调查确定了王子被使用的所有照片都是公开的 —— 使用 InstaLoader 下载照片和元数据,并使用反向图像搜索和 Google Dorks 查找发布照片的文章。在下面看到:
发现第一个危险信号。接下来就能够使用与该帐户有关的相同语言来查找多个帐户,以解决这个加密货币骗局。
这只是您可以处理 InstaLoader 提取的信息的一个示例。显然,它可以做很多事。
开源情报洞察力
InstaLoader 可能是最强大的 Instagram 开源情报调查工具之一。
尽管我喜欢它的所有功能和自定义功能,但文件输出的格式确实存在点问题。
我敢肯定这是可以调整的,但也是为什么在人脸识别的演示中使用了 Instalooter 而不是 InstaLoader。
更具体地说,不是将所有照片都转储到一个文件夹中,而是每张照片都有其自己的带有元数据的文件夹。这对组织非常有用,虽然也有点累。
由于 Instagram 由 Facebook 拥有,因此 Instagram 将来可能会收到类似的隐私保护措施;因此,很可能使 InstaLoader 之类的工具获得成功。
此外,普通用户可能会转向私有帐户,从而限制了挖掘工具的使用。这些问题都要考虑到。
在围绕Web抓取工具(例如 InstaLoader)构建基础结构之前,请牢记这些注意事项。⚪️
《InstaLoader – an OSINT Tool for Scraping Instagram Metadata》