Android逆向工程——认识Dalvik opcodes

Mitjavaz 发表于 2015-8-11 10:37:56

本帖最后由 Mitjavaz 于 2015-8-11 10:37 编辑

我是一名新人，这两天也发了两个很基础的东西，令大家见笑了。我的风格就是把我认为的，我所学会的东西，迫不及待地写出来，目的是既能给需要的人带来参考，也能给自己纠正错误理解。所以呢，今天，我依然是在写基础的东西。因为我是新人，所以每天学的进度有限，理解能力也有限，所以后期可能会写这样的体会心得的速度会放慢。毕竟后期慢慢深入进去，就是各种算法，各种机制，各种壳，各种注入之类的东西了。今天，给大家带来的是Dalvik opcodes方面的东西。相信大家经常会在反编译中看到，有时候修改个if语句，经常被if-ne和if-nez等等这样的代码整迷糊。今天的目的就是：认识Dalvik opcodes并且通过这个目的，为后期的：注入代码等技术手段打下扎实的基础。而本次就直接沿用上一篇：Android逆向工程——程序修改所提到的游戏作为实操对象。在上一篇文章中，我们找到并定位到了“狂热期结束”这个关键词，然后通过Android Killer定位到了关键词所在的类以及其所在的方法。然后通过修改IF条件语句中的判断条件，实现了延长功能，或者是说将功能的时候推延了。但是这依然不够完美，因为功能结束之后，又是一段等待期，相信很多人会厌烦这段时间，感觉很折磨人。那么，这次我就尝试着做永久性的修改操作。我们再看下代码：我在此以每一个IF语句作为一个模块来拆分，将其分成了三个模块。第一个IF语句是一个模块，它只有三个执行语句，分别是：int i2 = 1 + B;、B = i2;、和第二个IF语句。在程序设计上而言，IF语句就是一条判断语句，也只是一条执行语句，无论这条IF语句内包含了多少条执行语句，它都如简单的一条赋值语句一样的存在。第二个IF语句是一个模块，它有八条执行语句。第三个IF语句是第三个模块，它只有一条执行语句。从程序设计上，我们就大致把它的执行流程看了一下。然后在上一篇：Android逆向工程——程序修改此文中，我也大概解读了一下第一条和第二条IF语句主要是为了达到什么目的。第一条IF语句（if (A == 1)）：判断功能是否开启，即：游戏当前进行时的状态是否处于狂热期。第二条IF语句（if (i2 >= 1200)）：判断狂热期时间，即：游戏是否该关闭狂热状态，结束狂热期。由于我们在上一篇文章中，改动了第二条IF语句的条件模块中的常量“1200”，那么，我们换一个思维考虑。既然if (i2 >= 1200)是判断狂热期的结束，那它对应的所执行的语句，就是执行狂热期结束这一操作。而我们此次修改的目的是什么？实现永久狂热状态。既然是永久狂热状态，那我们是不是就能出这样一个预想，把这条语句整个删除不要，它是不是就没有结束狂热期这一个操作，也就实现了永久狂热期这一个目的。接着，我们再看下JAVA源码。既然要做删除，就得知道从哪删到哪。那么这里，我们在分析过功能之后，也都清楚，关键是第二条IF语句，它掌控着关闭状态的按钮。删除的方式有：1、针对性删除：也就是将关闭状态的执行语句删除。注：这样的删除有一个好处，就是删除的代码不多，但是不好的地方就在于在并不知晓具体是哪一句的时候，操作过程显得复杂繁琐，现在这里只有八条执行语句，假如最后一条执行语句才是关闭状态的执行语句，那么，就需要测试八次。所以，这里采用要说到的第二种方式。2、划区间删除：也就是将内嵌式的语句划分后删除。注：这种方式相对较好，但是不好的地方就是需要多分析，特别是在需要补充返回值的情况下。原始的Dalvik opcodes： sget v0, Lc/j;->A:I
if-ne v0, v5, :cond_3
sget v0, Lc/j;->B:I
add-int/lit8 v0, v0, 0x1
sput v0, Lc/j;->B:I
const/16 v2, 0x4b0
if-lt v0, v2, :cond_3
sput v1, Lc/j;->A:I
sput v1, Lc/j;->B:I
invoke-static {}, Lb/f;->a()Lb/f;
invoke-static {}, Lb/f;->h()I
move-result v0
if-nez v0, :cond_2
move v0, v5
:cond_2 iget v2, p0, Lc/j;->n:I
mul-int/lit8 v2, v2, 0x64
div-int v0, v2, v0
const/16 v2, 0x7d0
const/16 v4, 0x23
move v3, v1
invoke-static/range {v0 .. v5}, Lb/n;->a(IIIIIZ)I
move-result v6
move v0, v1
move v2, v7
move v3, v1
move v4, v8
invoke-static/range {v0 .. v5}, Lb/n;->a(IIIIIZ)I
move-result v0
add-int/2addr v0, v6
mul-int/lit8 v0, v0, 0x64
sput v0, Lc/j;->x:I
iget-object v0, p0, Lc/j;->au:Lf/a;
iget-object v0, v0, Lf/a;->d:La/h;
const-string v2, "\u72c2\u70ed\u671f\u7ed3\u675f\u3002"
invoke-virtual {v0, v2, v8}, La/h;->a(Ljava/lang/String;I)V
iget-object v0, p0, Lc/j;->au:Lf/a;
const/4 v2, 0x3

invoke-virtual {v0, v2}, Lf/a;->d(I)V删除的Dalvik opcodes： const/16 v2, 0x4b0
if-lt v0, v2, :cond_3
sput v1, Lc/j;->A:I
sput v1, Lc/j;->B:I
invoke-static {}, Lb/f;->a()Lb/f;
invoke-static {}, Lb/f;->h()I
move-result v0
if-nez v0, :cond_2
move v0, v5
:cond_2 iget v2, p0, Lc/j;->n:I
mul-int/lit8 v2, v2, 0x64
div-int v0, v2, v0
const/16 v2, 0x7d0
const/16 v4, 0x23
move v3, v1
invoke-static/range {v0 .. v5}, Lb/n;->a(IIIIIZ)I
move-result v6
move v0, v1
move v2, v7
move v3, v1
move v4, v8
invoke-static/range {v0 .. v5}, Lb/n;->a(IIIIIZ)I
move-result v0
add-int/2addr v0, v6
mul-int/lit8 v0, v0, 0x64
sput v0, Lc/j;->x:I
iget-object v0, p0, Lc/j;->au:Lf/a;
iget-object v0, v0, Lf/a;->d:La/h;
const-string v2, "\u72c2\u70ed\u671f\u7ed3\u675f\u3002"
invoke-virtual {v0, v2, v8}, La/h;->a(Ljava/lang/String;I)V
iget-object v0, p0, Lc/j;->au:Lf/a;
const/4 v2, 0x3
invoke-virtual {v0, v2}, Lf/a;->d(I)V最后保留的Dalvik opcodes：
我们看这最后保留的代码： sget v0, Lc/j;->A:I       //【sget vx, 字段ID 】这就是这一行的定式，表示：通过字段ID得到一个数据，将数据转交给vx保存。理解就是这么理解，但是官方化就不这么说。
if-ne v0, v5, :cond_3    //【if-ne vx,vy 目标】这就是if-ne的定式，表示：vx 不等于vy ，那么就跳转到目标。也就是说，假如这里的v0 不等于 v5 那么程序就不顺势往下执行，而是跳跃到:cond_3这个标记所在的地方。
sget v0, Lc/j;->B:I    //同第一条分析。
add-int/lit8 v0, v0, 0x1//加法运算：vx = vy + lit8，书写规范：add-int/lit8 vx,vy,lit8。
sput v0, Lc/j;->B:I    //注意，这里的意思是，将vx的数据保存到字段ID对应的存储地方。
if (A == 1) {    int i2 = 1 + B;    B = i2;
显然，一目了然了，我们保留的Dalvik opcodes和JAVA源码是一致的。其实，这里有一个难点，就是Dalvik opcodes太多种类了，我们对这些种类都没多少认识。我在这里找了相关资料，给大家提供一下：PDF版：http://pan.baidu.com/s/14pv46网页：http://pallergabor.uw.hu/androidblog/dalvik_opcodes.html
好了，归纳总结一下：做安卓逆向，就得学会跟Dalvik虚拟机打交道，而能与Dalvik虚拟机沟通的方式，就是Dalvik opcodes。
提升的方式：汇编编程原理。我不知道大家是怎么看待的，我是在理解的时候，感觉到这个Dalvik opcodes，其实跟汇编的原理差不多的，特别是在使用寄存器赋值，用寄存器传递值量的时候，除了换了一些字节码，基本上就跟汇编差不多。这里不要求大家都能懂汇编，但是至少能知道汇编的编程方式是怎么进行的。
希望大家能对这种编码规则看得懂，多少要理解，这对将来更深入学习，能打下基础。
好了，谢谢大家观看，若有什么不足，写得不对的，还望能指出。
这里留下一个我没写的，但是大家可以尝试去做的，就是将删除的那部分Dalvik opcodes，按JAVA源码显示出来的代码，将二者代码一一对应起来。
致谢：逆向未来技术社区

听鬼哥说故事 发表于 2015-8-11 13:18:10

很详细的基础资料，这两天发了不少帖子，给个精华，多总结，多发贴，多讨论，这样技术才会慢慢有提升，赞楼主~~

水波摇曳 发表于 2015-8-11 13:21:03

坚持！一定会学到，谢谢楼主分享
赞一个！

花墨发表于 2015-8-11 13:37:43

感谢楼主的分享！希望继续出精品！

永恒丶 发表于 2015-8-11 13:44:59

谢谢楼主分享！大赞！！！

peterdocter 发表于 2015-8-11 14:09:58

{:5_144:}越来越牛！

xin 发表于 2015-8-11 23:07:30

支持续集

大兵beyond 发表于 2015-8-12 18:10:59

加油。{:5_136:}

页: [1]

逆向未来技术社区's Archiver

Android逆向工程——认识Dalvik opcodes