freeBuf
主站

分类

漏洞 工具 极客 Web安全 系统安全 网络安全 无线安全 设备/客户端安全 数据安全 安全管理 企业安全 工控安全

特色

头条 人物志 活动 视频 观点 招聘 报告 资讯 区块链安全 标准与合规 容器安全 公开课

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

ScrapPY:一款功能强大的文档数据爬取和字典生成工具
2023-08-10 14:35:16

关于ScrapPY

ScrapPY是一款功能强大的文档数据爬取和字典生成工具,该工具基于Python开发,可以帮助广大研究人员抓取手册、文档和其他敏感PDF,以生成安全工具可以直接使用的有针对性的字典列表来执行暴力破解、强制浏览和字典攻击。

ScrapPY可以执行词频、熵和元数据分析,并可以在全输出模式下运行,为有针对性的攻击创建自定义字典列表。该工具可以通过深入分析,发现潜在密码或隐藏目录的关键字和短语,生成可读的文本文件,并输出到Hydra、Dirb和Nmap等工具。

简而言之,在ScrapPY的帮助下,广大研究人员能够快速实现初始访问、漏洞扫描和横向移动。

工具安装

由于该工具基于Python 3开发,因此我们首先需要在本地设备上安装并配置好Python 3环境。接下来,广大研究人员可以使用下列命令将该项目源码克隆至本地:

$ mkdir ScrapPY

$ cd ScrapPY/

$ sudo git clone https://github.com/RoseSecurity/ScrapPY.git

然后切换到项目目录中,使用pip 3命令和项目提供的requirements.txt文件安装该工具所需的其他依赖组件:

$ pip3 install -r requirements.txt

工具使用

usage: ScrapPY.py [-h] [-f FILE] [-m {word-frequency,full,metadata,entropy}] [-o OUTPUT]

输出文档元数据:

$ python3 ScrapPY.py -f example.pdf -m metadata

将前100个常用单词输出到名为Top_100_Keywords.txt的文件中:

$ python3 ScrapPY.py -f example.pdf -m word-frequency -o Top_100_Keywords.txt

将所有的关键词输出到默认的ScrapPY.txt文件中:

$ python3 ScrapPY.py -f example.pdf

将前100个熵最高的单词输出:

$ python3 ScrapPY.py -f example.pdf -m entropy

ScrapPY输出结果:

# ScrapPY outputs the ScrapPY.txt file or specified name file to the directory in which the tool was ran. To view the first fifty lines of the file, run this command:

 

$ head -50 ScrapPY.txt

 

# To see how many words were generated, run this command:

 

$ wc -l ScrapPY.txt

与其他安全工具集成

该工具可以轻松与例如Dirb之类的其他安全工具进行集成,以加快发现隐藏子目录的过程:

root@RoseSecurity:~# dirb http://192.168.1.123/ /root/ScrapPY/ScrapPY.txt

 

-----------------

DIRB v2.21

By The Dark Raver

-----------------

 

START_TIME: Fri May 16 13:41:45 2014

URL_BASE: http://192.168.1.123/

WORDLIST_FILES: /root/ScrapPY/ScrapPY.txt

 

-----------------

 

GENERATED WORDS: 4592

 

---- Scanning URL: http://192.168.1.123/ ----

==> DIRECTORY: http://192.168.1.123/vi/

+ http://192.168.1.123/programming (CODE:200|SIZE:2726)

+ http://192.168.1.123/s7-logic/ (CODE:403|SIZE:1122)

==> DIRECTORY: http://192.168.1.123/config/

==> DIRECTORY: http://192.168.1.123/docs/

==> DIRECTORY: http://192.168.1.123/external/

将ScrapPY与Hydra一起使用可以执行高级暴力破解攻击:

root@RoseSecurity:~# hydra -l root -P /root/ScrapPY/ScrapPY.txt -t 6 ssh://192.168.1.123

Hydra v7.6 (c)2013 by van Hauser/THC & David Maciejak - for legal purposes only

 

Hydra (http://www.thc.org/thc-hydra) starting at 2014-05-19 07:53:33

[DATA] 6 tasks, 1 server, 1003 login tries (l:1/p:1003), ~167 tries per task

[DATA] attacking service ssh on port 22

使用ScrapPY生成的字典与Nmap脚本结合使用:

nmap -p445 --script smb-brute.nse --script-args userdb=users.txt,passdb=ScrapPY.txt 192.168.1.123

工具使用演示

演示视频:【点我观看

项目地址

ScrapPY:【GitHub传送门

# 暴力破解 # 字典生成 # 敏感数据 # PDF # 文档安全
本文为 独立观点,未经允许不得转载,授权请联系FreeBuf客服小蜜蜂,微信:freebee2022
被以下专辑收录,发现更多精彩内容
+ 收入我的专辑
+ 加入我的收藏
相关推荐
  • 0 文章数
  • 0 关注者
文章目录