离线下载
PDF版 ePub版

念茜 · 更新于 2018-11-28 11:00:43

Fishhook

众所周知,Objective-C 的首选 hook 方案为 Method Swizzle,于是大家纷纷表示核心内容应该用 C 写。

接下来进阶说说 iOS 下 C 函数的 hook 方案,先介绍第一种方案--- fishhook .

什么是 fishhook

fishhook 是 facebook 提供的一个动态修改链接 Mach-O 符号表的开源工具。

什么是 Mach-O

Mach-O 为 Mach Object 文件格式的缩写,也是用于 iOS 可执行文件,目标代码,动态库,内核转储的文件格式。

Mach-O 有自己的 dylib 规范。

fishhook 的原理

详见官方的 How it works,这里我作个简要说明。

dyld 链接 2 种符号,lazy 和 non-lazy ,fishhook 可以重新链接/替换本地符号。

fishhook1

如图所示,__DATA区有两个 section 和动态符号链接相关:__nl_symbol_ptr__la_symbol_ptr__nl_symbol_ptr 为一个指针数组,直接对应 non-lazy 绑定数据。__la_symbol_ptr 也是一个指针数组,通过dyld_stub_binder 辅助链接。<mach-o/loader.h>的 section 头提供符号表的偏移量。

图示中,1061 是间接符号表的偏移量,*(偏移量+间接符号地址)=16343,即符号表偏移量。符号表中每一个结构都是一个 nlist 结构体,其中包含字符表偏移量。通过字符表偏移量最终确定函数指针。

fishhook 就是对间接符号表的偏移量动的手脚,提供一个假的 nlist 结构体,从而达到 hook 的目的。

fishhook 替换符号函数:

int rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel) {  
  int retval = prepend_rebindings(rebindings, rebindings_nel);  
  if (retval < 0) {  
    return retval;  
  }  
  // If this was the first call, register callback for image additions (which is also invoked for  
  // existing images, otherwise, just run on existing images  
  if (!rebindings_head->next) {  
    _dyld_register_func_for_add_image(rebind_symbols_for_image);  
  } else {  
    uint32_t c = _dyld_image_count();  
    for (uint32_t i = 0; i < c; i++) {  
      rebind_symbols_for_image(_dyld_get_image_header(i), _dyld_get_image_vmaddr_slide(i));  
    }  
  }  
  return retval;  
} 

关键函数是 _dyld_register_func_for_add_image,这个函数是用来注册回调,当 dyld 链接符号时,调用此回调函数。 rebind_symbols_for_image 做了具体的替换和填充。

fishhook 替换 Core Foundation 函数的例子

以下是官方提供的替换 Core Foundation 中 open 和 close 函数的实例代码

#import <dlfcn.h>  

#import <UIKit/UIKit.h>  

#import "AppDelegate.h"  
#import "fishhook.h"  

static int (*orig_close)(int);  
static int (*orig_open)(const charchar *, int, ...);  

void save_original_symbols() {  
  orig_close = dlsym(RTLD_DEFAULT, "close");  
  orig_open = dlsym(RTLD_DEFAULT, "open");  
}  

int my_close(int fd) {  
  printf("Calling real close(%d)\n", fd);  
  return orig_close(fd);  
}  

int my_open(const charchar *path, int oflag, ...) {  
  va_list ap = {0};  
  mode_t mode = 0;  

  if ((oflag & O_CREAT) != 0) {  
    // mode only applies to O_CREAT  
    va_start(ap, oflag);  
    mode = va_arg(ap, int);  
    va_end(ap);  
    printf("Calling real open('%s', %d, %d)\n", path, oflag, mode);  
    return orig_open(path, oflag, mode);  
  } else {  
    printf("Calling real open('%s', %d)\n", path, oflag);  
    return orig_open(path, oflag, mode);  
  }  
}  

int main(int argc, charchar * argv[])  
{  
  @autoreleasepool {  
    save_original_symbols();  
    //fishhook用法  
    rebind_symbols((struct rebinding[2]){{"close", my_close}, {"open", my_open}}, 2);  

    // Open our own binary and print out first 4 bytes (which is the same  
    // for all Mach-O binaries on a given architecture)  
    int fd = open(argv[0], O_RDONLY);  
    uint32_t magic_number = 0;  
    read(fd, &magic_number, 4);  
    printf("Mach-O Magic Number: %x \n", magic_number);  
    close(fd);  

    return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));  
  }  
}  

注释 // fishhook 用法处: rebind_symbols((struct rebinding[2]){{"close", my_close}, {"open", my_open}}, 2);

传入 rebind_symbols 的第一个参数是一个结构体数组,大括号中为对应数组内容。

不得不说,facebook 忒 NB 。