[原创]一种将LLVM Pass集成到NDK中的通用方法
source link: https://bbs.pediy.com/thread-271271.htm
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
关于“如何将自己写的LLVM Pass集成到NDK中”这个问题,目前网上并没有很完美的方法,并且大多数已经过时。史上最优雅的NDK加载pass方案此贴中提出的方法也很麻烦,在我看来并不算太“优雅”。经过我的一番折腾,最终摸索出了一种比较简单实用的方法,可供参考。
0x00. 概览
简单来说,本文要介绍的方法是下载NDK中llvm-android
部分的源码,在llvm-android
中的llvm-project
子项目中加入自己的Pass后与整个项目一起编译,用编译好的文件替换掉NDK中的工具链。
该方法有以下优点:
- Windows、macOS、Linux通用,各NDK版本也通用
- 理论上加入自己的Pass后不会出现不兼容的问题
- 操作过程简单易懂
当然也有缺点:
- 无法直接照搬OLLVM、Hikari、Armariris等现成项目的源码,需要手动做一些迁移
- 第一次编译比较耗时
0x01. 操作流程
本文并不是直接将最终的操作方法摆在大家面前,还讲解了为什么要这么操作,因此过程会显得较冗长,需要有一点耐心看下去。
1. 环境准备
如果是Windows,首先需要准备Linux虚拟机进行交叉编译,因为NDK不支持在Windows上直接编译,我这里使用的是Ubuntu 20.04.3;macOS则不需要。NDK版本我选择的是23.1.7779620。
本文以Windows+Linux虚拟机为例讲解,macOS下的操作大同小异。
以下使用的指令全部以root权限执行。
2. 下载 llvm-android 源代码
NDK使用的是git-repo
这一工具管理,而不是git
,所以首先需要安装git-repo
:
curl https:
/
/
storage.googleapis.com
/
git
-
repo
-
downloads
/
repo >
/
usr
/
bin
/
repo
chmod a
+
x
/
usr
/
bin
/
repo
上面这个地址需要科学上网才能访问,我们可以换成国内的清华源:
curl https:
/
/
mirrors.tuna.tsinghua.edu.cn
/
git
/
git
-
repo >
/
usr
/
bin
/
repo
chmod a
+
x
/
usr
/
bin
/
repo
在$NDK_PATH\toolchains\llvm\prebuilt\windows-x86_64\AndroidVersion.txt
中查看NDK使用的LLVM版本,在我使用的NDK中,AndroidVersion.txt 的内容是:
12.0
.
8
based on r416183c1
在https://android.googlesource.com/toolchain/llvm_android/
中找到对应版本的 llvm-android 源码:
Google的文档中给出了下载 llvm-android 源代码的方法,但这里默认下载的是最新版本:
mkdir llvm
-
toolchain && cd llvm
-
toolchain
repo init
-
u https:
/
/
android.googlesource.com
/
platform
/
manifest
-
b llvm
-
toolchain
repo sync
-
c
我们需要做一些操作来换成我们想要的版本,在$NDK_PATH\toolchains\llvm\prebuilt\windows-x86_64
目录下找到一个 manifest_xxxx.xml 文件,我这里是 manifest_7714059.xml。执行完下列指令后:
mkdir llvm
-
toolchain && cd llvm
-
toolchain
repo init
-
u
将 manifest_7714059.xml 复制到.repo/mainifests
文件夹中(注意.repo是隐藏文件夹,并且从Windows复制到Linux会有格式转换的问题,这里建议使用VSCode的SSH-Remote插件避免上述问题):
继续执行:
repo
-
m manifest_7714059.xml
repo sync
-
c
这里也要把Google的地址换成清华源,替换规则见 Android 镜像使用帮助,替换后完整的指令如下:
mkdir llvm
-
toolchain && cd llvm
-
toolchain
repo init
-
u
https:
/
/
mirrors.tuna.tsinghua.edu.cn
/
git
/
AOSP
/
platform
/
manifest
-
b llvm
-
toolchain
repo
-
m manifest_7714059.xml
repo sync
-
c
并且 manifest_7714059.xml 中的包含地址也要替换,否则即使科学上网,在下载的时候也非常慢:repo sync -c
指令会下载一大堆的源代码和预编译文件,需要耗费十来分钟的样子,喝杯茶慢慢等吧。
3. 编译 llvm-android 源代码
在编译之前需要提前安装一些环境,否则编译会出错:
apt install cmake bison
如果是在Ubuntu 20.04.3下还需要做一个软链接,否则会报错ImportError: libffi.so.6: cannot open shared object file: No such file or directory
。具体操作如下:
然后就可以开始愉快且漫长的编译了(大概需要一两个小时,取决于机器性能):
python toolchain
/
llvm_android
/
build.py
-
-
no
-
build linux
因为我是在Windows环境使用NDK,所以无需编译Linux下的toolchain,这里加上--no-build linux
参数。
另外编译的时候最好把虚拟机内存开到8G以上,我开的是8G内存,编译的时候还会因为内存不足时不时中断,如果中断了重新运行编译指令就好。
编译结束后可以在out
文件夹中找到编译好的内容:
4. 加入自己的 Pass 并重新编译
在这里我要推销一下我的项目Pluto-Obfuscator
,如果使用的是OLLVM, Armariris等,需要注意一下版本适配的问题。
此时我们需要向toolchain/llvm-project/llvm/lib/Transforms/Obfuscation/
中加入自己的代码:
向toolchain/llvm-project/llvm/lib/Transforms/IPO/PassManagerBuilder.cpp
中加入几段代码:
修改toolchain/llvm-project/llvm/lib/Transforms/IPO/CMakeLists.txt
:
改好之后重新编译,重新编译的速度会快很多,一分钟左右就能搞定:
python toolchain
/
llvm_android
/
build.py
-
-
no
-
build linux
编译好后out/install/windows-x86/clang-dev
中对应的就是NDK中的toolchains\llvm\prebuilt\windows-x86_64
部分:
少了一些东西,但是无关紧要,我们直接替换就好。
0x03. 效果测试
我复制了一份NDK,命名为pluto-r23
,并将其中toolchains\llvm\prebuilt\windows-x86_64
文件夹里的内容替换成我们刚刚编译的内容:
随便写一个Native项目测试:
设置NDK地址:
加上混淆参数:
编译然后查看混淆效果:
X86架构和ARM架构均混淆成功:
【公告】看雪团队招聘安全工程师,将兴趣和工作融合在一起!看雪20年安全圈的口碑,助你快速成长!
Recommend
-
20
前段时间和@lufei 大哥学习了一波Linux下基于文件描述符的反序列化回显方式的思路。 在自己实现的过程中发现,是通过IP和端口号的筛选,从而过滤出当前线程(也可以说是请求)的文件描述符,进而加入回显的内容。 但是...
-
14
随着走向成熟的以太坊 Layer-2 解决方案多了起来,ENS 也要能为整个生态系统提供服务,同时让 ENS 用户能够获得 Layer-2 解决方案给他们带来的效率提升。自
-
4
LLVM Dataflow Info Printer Pass Tell us what some of LLVM's dataflow analyses think about the code being compiled. Requirements LLVM 9 or higher cmake 3.7 Build mkdir build...
-
3
LLVM Pass与程序分析LLVM Pass与程序分析 Feb 23, 2020 注:本文所用LLVM版本为3.8 0. Overview 根据官方介绍,
-
6
一种C#读写二进制文件的通用方法 在日常的工作中,我们经常需要进行一些二进制文件或协议的读写操作,...
-
5
颜色标记法-一种通用且简明的树遍历方法 - 二叉树的中序遍历 - 力扣(LeetCode)颜色标记法-一种通用且简明的树遍历方法
-
7
New issue Handle old LLVM pass manager on rustc 1.57 #197
-
18
通用PVE AIO安装教程: 通用PVE集成软路由,KODI,基于LXC的Docker服务教程 Create your Gitee Account Explore and code with more than 8 million developers,Free private repositories !:)
-
1
LLVM IR(Intermediate Representation) 是LLVM的一种中间表示,也可以将它视为中间代码。 中间代码 的生成是为了便于更好的 代码优化。 LLVM Pass 是LLVM代码优化(optimi...
-
5
[C++] - GCC和LLVM对方法 warning: non-void function does not return a value [-Wreturn-type] 的处理差异
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK