Android7.0 Rild工作流程 - Android移动开发技术文章_手机开发 - - JOYK Joy of Geek, Geek News, Link all geek

一、基于Rild的通信架构

一般智能手机的硬件架构都是两个处理器：
一个处理器用来运行操作系统，上面运行应用程序，这个处理器称作Application Processor，简称AP；另一个处理负责和射频无线通信相关的工作，叫Baseband Processor，简称BP。

在Android系统中，Rild运行在AP上，它是AP和BP在软件层上通信的中枢。

目前通过Rild，AP和BP的通信方式可以分为两种：
第一种是AP发送请求给BP，BP响应并回复AP。此时，BP通过Rild回复的请求被称为solicited Response。
第二种是BP主动发送信息给AP。在这种情况下，BP通过Rild发送的请求被称为unsolicited Response。

基于Rild进程的整个通信架构，基本上如上图所示。
从图中我们可以看出：
1、Android框架部分，是通过Phone进程与Rild进程通信的。它们之间的通信方式采用的是socket。
在前面介绍PhoneApp启动时，我们知道Phone进程中有两个Phone对象。每个Phone对象持有一个socket，与对应的Rild进程通信。因此，我们知道手机中实际上启动了两个Rild进程（双卡手机）。

shell:/ $ ps | grep rild
radio     572   1     113732 14792 hrtimer_na 0000000000 S /system/bin/rild
radio     869   1     109604 13944 hrtimer_na 0000000000 S /system/bin/rild

shell:/ $ ps | grep phone
radio     2621  605   2019984 74424 SyS_epoll_ 0000000000 S com.android.phone

shell:/ $ ps | grep init
root      1     0     9648   1712  SyS_epoll_ 0000000000 S /init

shell:/ $ ps | grep zygote
root      605   1     2195280 70956 poll_sched 0000000000 S zygote64
root      606   1     1610708 59144 poll_sched 0000000000 S zygote

我们通过usb连接手机后，通过adb shell进入终端，通过ps和grep命令，可以得到上述结果。
明显可以看到一个Phone进程对应者两个Rild进程；同时Rild进程由init进程加载，Phone进程由zygote进程加载。

2、Rild与BP之间并没有直接通信，而是引入了厂商的动态库。
这种设计应该是为了保证灵活性吧。
用面向对象的思想来看，我们可以认为Rild是一个接口，定义了AP、BP双向通信时需要使用的最基本的函数。不同的厂商都需要满足这个接口，以提供手机最基本的通信功能。
至于具体如何实现，是完全独立和自由的。

二、Rild的启动
在hardware/ril/rild/rild.rc中定义了Rild启动时对应的选项：

service ril-daemon /system/bin/rild
    class main
    socket rild stream 660 root radio
    socket sap_uim_socket1 stream 660 bluetooth bluetooth
    socket rild-debug stream 660 radio system
    user root
    group radio cache inet misc audio log readproc wakelock

在Android 7.0之前的版本中，该文件的内容是被定义在init.rc中的。
到了Android7.0 之后，init.rc文件中的许多内容均被移出，添加到各个进程中。如前面分析Vold进程时，对应的启动文件定义于vold.rc中。
个人猜测这些文件应该会在编译时，重新集成起来，毕竟在在rild对应的Android.mk中增加了下述字段：

.......
LOCAL_MODULE:= rild
LOCAL_MODULE_TAGS := optional
//新增字段
LOCAL_INIT_RC := rild.rc
.......

目前手边没有Android7.0的机器，还不好验证，以后有机会再做尝试。

init进程根据rild.rc文件启动一个Rild进程，还需要根据厂商定义的rc文件启动另一个Rild进程。
厂商定义的rc文件中，与Rild进程相关的主要内容与rild.rc相似，就是socket名称不同。对于第二个Rild进程，其socket名应该为rild2。

现在我们看看Rild进程的main函数，定义于rild.c中：

int main(int argc, char **argv) {
    //rilLibPath用于指定动态库的位置
    const char * rilLibPath = NULL;
    ........
    //Rild规定动态库必须实现一个叫做Ril_init的函数，这个函数的第一个参数指向结构体RIL_Env
    //而它的返回值指向结构体RIL_RadioFunctions
    const RIL_RadioFunctions *(*rilInit)(const struct RIL_Env *, int, char **);
    ........
    const RIL_RadioFunctions *funcs;
    char libPath[PROPERTY_VALUE_MAX];
    //解析参数
    ........

    if (strncmp(clientId, "0", MAX_CLIENT_ID_LENGTH)) {
        strlcat(rild, clientId, MAX_SOCKET_NAME_LENGTH);
        //注意此处调用了ril.cpp中的函数，保存了Rild进程对应socket的名字，后文还会提到
        RIL_setRilSocketName(rild);
    }

    if (rilLibPath == NULL) {
        //读取系统属性，LIB_PATH_PROPERTY的值为rild.libpath
        //原生的属性值定义于build/target/board/generic/system.prop文件中
        //实际的手机中将会使用厂商指定的system.prop文件
        if ( 0 == property_get(LIB_PATH_PROPERTY, libPath, NULL)) {
            // No lib sepcified on the command line, and nothing set in props.
            // Assume "no-ril" case.
            goto done;
        } else {
            rilLibPath = libPath;
        }
    }
    ..........
    //根据动态库位置，利用dlopen打开动态库
    dlHandle = dlopen(rilLibPath, RTLD_NOW);
    ..........
    //1、启动EventLoop，事件处理
    RIL_startEventLoop()

    //从动态库中的到RIL_Init函数的地址
    rilInit =
        (const RIL_RadioFunctions *(*)(const struct RIL_Env *, int, char **))
        dlsym(dlHandle, "RIL_Init");
    ......
    //2、调用RIL_init函数
    funcs = rilInit(&s_rilEnv, argc, rilArgv);
    RLOGD("RIL_Init rilInit completed");

    //3、注册funcs到Rild中
    RIL_register(funcs);
    ........
done:

    RLOGD("RIL_Init starting sleep loop");
    while (true) {
        sleep(UINT32_MAX);
    }
}

根据Rild的main函数，我们可以看出主要就进行了三件事：启动Event Loop、调用RIL_Init函数和注册库函数。
接下来我们分别分析一下主要事件对应的流程。

1、 RIL_startEventLoop
RIL_startEventLoop定义于hardware/ril/libril/ril.cpp中：

extern "C" void
RIL_startEventLoop(void) {
    /* spin up eventLoop thread and wait for it to get started */
    s_started = 0;
    .........
    //创建工作线程，线程ID存入s_tid_dispatch，对应执行函数为eventLoop
    int result = pthread_create(&s_tid_dispatch, &attr, eventLoop, NULL);
    .........
    //工作线程eventLoop运行后，会设置s_started为1，并触发s_startupCond
    //这里的等待的目的是保证RIL_startEventLoop返回前，工作线程创建并运行成功
    while (s_started == 0) {
        pthread_cond_wait(&s_startupCond, &s_startupMutex);
    }
    .........
}

我们需要跟进eventLoop函数：

static void *
eventLoop(void *param) {
    int ret;
    int filedes[2];

    //1、初始化内部数据结构
    ril_event_init();

    pthread_mutex_lock(&s_startupMutex);

    //通知RIL_startEventLoop本线程已经创建并成功运行了
    s_started = 1;
    pthread_cond_broadcast(&s_startupCond);

    pthread_mutex_unlock(&s_startupMutex);

    //创建匿名管道
    ret = pipe(filedes);
    ........
    s_fdWakeupRead = filedes[0];
    s_fdWakeupWrite = filedes[1];
    //设置读端口为非阻塞的
    fcntl(s_fdWakeupRead, F_SETFL, O_NONBLOCK);

    //2、创建一个ril_event
    ril_event_set (&s_wakeupfd_event, s_fdWakeupRead, true,
                processWakeupCallback, NULL);

    //3、将创建出的ril_event加入到event队列中
    rilEventAddWakeup (&s_wakeupfd_event);

    //4、进入事件等待循环中
    ril_event_loop();
    .........    
}

1.1 初始化内部数据结构
我们先看看ril_event_init函数：

void ril_event_init()
{
    MUTEX_INIT();

    FD_ZERO(&readFds);
    //初始化timer_list，任务插入时按时间排序
    init_list(&timer_list);
    //初始化pending_list，保存每次需要执行的任务
    init_list(&pending_list);
    //初始化监控表
    memset(watch_table, 0, sizeof(watch_table));
}

static void init_list(struct ril_event * list)
{
    memset(list, 0, sizeof(struct ril_event));
    list->next = list;
    list->prev = list;
    list->fd = -1;
}

//MAX_FD_EVENTS为8
//watchtable将用于保存FD加入到readFDs中的ril_event
static struct ril_event * watch_table[MAX_FD_EVENTS];

可以看出ril_event_init就是初始化readFds、timer_list、pending_list和watch_table，其中后三种数据结构均是用来存放ril_event的。

根据前文的代码，我们知道Rild的main函数中，通过调用RIL_startEventLoop单独启动了一个线程运行eventLoop，这是一个工作线程。
这个工作线程就是靠ril_event结构体来描述自己需要执行的任务，并且它将多个任务按时间顺序组织起来，保存在任务队列中。
ril_event的数据结构如下：

struct ril_event {
    struct ril_event *next;
    struct ril_event *prev;

    int fd;
    int index;
    bool persist;
    struct timeval timeout;
    ril_event_cb func;
    void *param;
};

如果从设计模式的角度来理解Rild的工作线程，易于看出，这其实是比较典型的命令模式。
就如同之前博客分析vold进程一样，CommandListener收到数据后，调用对应Command的runCommand方法进行处理。
此处，工作线程收到ril_event后，加入队列中，当需要处理时，调用ril_event对应的处理函数func。

1.2 创建wakeupfd ril_event
工作线程完成数据结构的初始化后，创建了第一个ril_event:

........
ril_event_set (&s_wakeupfd_event, s_fdWakeupRead, true,
            processWakeupCallback, NULL);
........

// Initialize an event
void ril_event_set(struct ril_event * ev, int fd, bool persist, ril_event_cb func, void * param)
{
    dlog("~~~~ ril_event_set %x ~~~~", (unsigned int)ev);
    memset(ev, 0, sizeof(struct ril_event));
    ev->fd = fd;
    ev->index = -1;
    ev->persist = persist;
    ev->func = func;
    ev->param = param;
    fcntl(fd, F_SETFL, O_NONBLOCK);
}

从上面的代码可以看出，创建的第一个ril_event的fd为管道的读端、回调函数为processWakeupCallback，同时persist属性为true。

1.3 将创建出的ril_event加入到event队列中

static void rilEventAddWakeup(struct ril_event *ev) {
    ril_event_add(ev);
    triggerEvLoop();
}

// Add event to watch list
void ril_event_add(struct ril_event * ev)
{
    dlog("~~~~ +ril_event_add ~~~~");
    MUTEX_ACQUIRE();
    for (int i = 0; i < MAX_FD_EVENTS; i++) {
        //找到第一个空闲索引加入
        if (watch_table[i] == NULL) {
            watch_table[i] = ev;
            //ril
            ev->index = i;
            dlog("~~~~ added at %d ~~~~", i);
            dump_event(ev);
            //将ril_event对应的fd加入到readFds
            FD_SET(ev->fd, &readFds);
            //select的限制，第一个参数为监听总数+1
            if (ev->fd >= nfds) nfds = ev->fd+1;
            dlog("~~~~ nfds = %d ~~~~", nfds);
            break;
        }
    }
    MUTEX_RELEASE();
    dlog("~~~~ -ril_event_add ~~~~");
}

static void triggerEvLoop() {
    int ret;
    //pthread_self返回调用线程的线程ID
    //这里调用triggerEvLoop的就是eventLoop，因此不进入该分支
    if (!pthread_equal(pthread_self(), s_tid_dispatch)) {
        /* trigger event loop to wakeup. No reason to do this,
         * if we're in the event loop thread */
         do {
            //但看代码我们知道，如果其它线程调用rilEventAddWakeup加入ril_event时，就会向pipe的写端写入数据
            ret = write (s_fdWakeupWrite, " ", 1);
         } while (ret < 0 && errno == EINTR);
    }
}

1.4 进入事件等待循环中
接下来工作线程进入到事件等待循环中：

void ril_event_loop() {
    ........
    for (;;) {
        // make local copy of read fd_set
        memcpy(&rfds, &readFds, sizeof(fd_set));
        //根据timer_list来计算select函数等待的时间，timer_list已经按任务的执行时间排序
        if (-1 == calcNextTimeout(&tv)) {
            // no pending timers; block indefinitely
            dlog("~~~~ no timers; blocking indefinitely ~~~~");
            ptv = NULL;
        } else {
            dlog("~~~~ blocking for %ds + %dus ~~~~", (int)tv.tv_sec, (int)tv.tv_usec);
            ptv = &tv;
        }
        ............
        n = select(nfds, &rfds, NULL, NULL, ptv);
        //将timer_list中超时的任务加入到pending_list中
        processTimeouts();
        //将watchtables中收到的任务加入到pending_list中
        processReadReadies(&rfds, n);
        //处理pendinglist中的任务
        firePending();
    }
}

static int calcNextTimeout(struct timeval * tv) 
{
    struct ril_event * tev = timer_list.next;
    struct timeval now;

    //利用clock_gettime获取当前时间
    getNow(&now);

    // Sorted list, so calc based on first node
    if (tev == &timer_list) {
        // no pending timers
        return -1;
    }

    if (timercmp(&tev->timeout, &now, >)) {
        //计算出等待时间
        timersub(&tev->timeout, &now, tv);
    } else {
        // timer already expired.
        tv->tv_sec = tv->tv_usec = 0;
    }
    return 0;
}

static void processTimeouts()
{
    ............
    struct timeval now;
    struct ril_event * tev = timer_list.next;
    struct ril_event * next;

    getNow(&now);
    ............
    //目前还没提及timer_list，实际上调用ril_timer_add函数时，可以将对时间有要求的ril_event加入到timer_list中，按照超时时间从小到大排列
    while ((tev != &timer_list) && (timercmp(&now, &tev->timeout, >))) {
        // Timer expired
        dlog("~~~~ firing timer ~~~~");
        next = tev->next;
        removeFromList(tev);
        //轮询timerlist表，将timer_list中的任务加入到pending_list中
        addToList(tev, &pending_list);
        tev = next;
    }
}

static void processReadReadies(fd_set * rfds, int n)
{
    ..........
    //前面代码已提过，当调用ril_event_add时，新加入的ril_event将存入watch_table
    for (int i = 0; (i < MAX_FD_EVENTS) && (n > 0); i++) {
        struct ril_event * rev = watch_table[i];
        if (rev != NULL && FD_ISSET(rev->fd, rfds)) {
            addToList(rev, &pending_list);
            //persist值为false时，才会移除
            //记得么？在eventLoop调用ril_event_loop前，加入了一个s_wakeupfd_event，其persist值为true，永不移除
            if (rev->persist == false) {
                removeWatch(rev, i);
            }
            n--;
        }
    }
    ..........
}

static void firePending() {
    ...........
    struct ril_event * ev = pending_list.next;
    while (ev != &pending_list) {
        struct ril_event * next = ev->next;
        removeFromList(ev);
        //执行对对应的执行函数
        //每次循环时s_wakeupfd_event的执行函数processWakeupCallback都会被调用
        ev->func(ev->fd, 0, ev->param);
        ev = next;
    }
    ..........
}

static void processWakeupCallback(int fd, short flags, void *param) {
    .......
    /* empty our wakeup socket out */
    do {
        //当有其它线程调用triggerEvLoop时，会向s_fdWakeupWrite中写入数据
        //s_wakeupfd_event被触发时，负责清空缓存
        ret = read(s_fdWakeupRead, &buff, sizeof(buff));
    } while (ret > 0 || (ret < 0 && errno == EINTR));
}

至此，RIL_startEventLoop的工作介绍完毕，虽然还没有实际开始工作，但它搭建出了整个事件的处理框架。这里涉及的代码比较繁杂，我们还是借助于图形总结一下整个过程：

1.4.1 整体架构
如上图所示，Rild的main函数中调用RIL_startEventLoop。在RIL_startEventLoop中创建出工作线程，执行eventLoop函数：
Step 1、利用ril_event_init函数初始化数据结构，主要包括readFds、timer_list、pending_list和watch_table；

Step 2、创建出一个pipe对象；

Step 3、创建s_wakeupfd_event，该event的fd指定为pipe的读端；这个event将被加入到watch_table，同时pipe的读端将被加入到readFds中；注意这个event的persist属性为true，于是将永远存在于watch_table中；

Step 4、调用ril_event_loop开始监听事件的到来。

先在我们结合图形，举几个例子看看，整个事件处理框架是如何工作的。
注意到初始时，timer_list为空，因此ril_event_loop中将不限时地等待readFds。

1.4.2 ril_event加入到timer_list
当其它线程调用ril_timer_add函数（定义于ril_event.cpp中）填加ril_event事件时：
Step 1、新到来的ril_event将按超时时间，由小到大加入到timer_list中；同时，其它线程一般会调用triggerEvLoop，该函数将会向pipe的写端写入数据。

Step 2、于是，pipe的读端将会收到数据；由于初始时pipe读端已经加入到来readFds，因此ril_event_loop将从等待中唤醒。

Step 3、此时，ril_event_loop将执行timer_list和watch_table中存储的事件。注意到在timer_list中，只有超时的事件才会被处理；在watch_table中，只有对应fd已经存入readFds（此时使用的是拷贝对象）的事件才会被执行。
注意到初始时加入watch_table的s_wakeupfd_event，永远满足执行条件；因此，每次ril_event_loop被唤醒时，该事件都被添加到pending_list。
s_wakeupfd_event对应的执行函数，将会清空pipe的buffer。

Step 4、 处理完加入到pending_list中的事件后，ril_event_loop将根据timer_list中事件的超时时间，决定等待readFds的时间。
如果在等待超时之前，没有其它事件到来，那么ril_event_loop将在等待超时后处理timer_list中的事件；否则，仅会处理新到来的事件，不会处理timer_list事件。

1.4.3 ril_event加入到watch_table
当其它线程调用ril_event_add函数（定义于ril_event.cpp中）增加ril_event事件时：
Step 1、当watch_table有空位时，新加入的ril_event将被加入到watch_table中，同时对应的fd被添加到readFds；同时，其它线程可能会调用triggerEvLoop，以唤醒ril_event_loop。

Step 2、 ril_event_loop被唤醒后，并不会执行新加入到watch_table中的ril_event，因为它们的fd才刚被加入到readFds中。
从代码里我们可以看到，ril_event_loop当次循环处理的是readFds的拷贝对应的数据，因此新加入watch_table的ril_event在下次唤醒时才能够被处理。

Step 3、由于加入ril_event对应的fd被加入到readFds中，因此如果对应的fd写入数据时，也会唤醒ril_event_loop。

至此，RIL_startEventLoop的主要流程介绍完毕，可以看到它的主要工作就是启动工作线程，然后等待事件的添加
那么接下来我们可以看看下一个Rild中下一个重要操作，即调用RIL_Init函数。

2、 RIL_Init
RIL_Init定义于动态库中，考虑到厂商的保密性，我们只能分析Android原生的Reference-ril库。
在Android的原生库中，RIL_Init定义于hardware/ril/reference-ril/reference-ril.c中。

const RIL_RadioFunctions *RIL_Init(const struct RIL_Env *env, int argc, char **argv)
{
    .............
    s_rilenv = env;
    //参数处理
    ...........
    pthread_attr_init (&attr);
    pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
    ret = pthread_create(&s_tid_mainloop, &attr, mainLoop, NULL);

    return &s_callbacks;
}

/*** Static Variables ***/
static const RIL_RadioFunctions s_callbacks = {
    RIL_VERSION,
    //以下皆是函数指针
    onRequest,
    currentState,
    onSupports,
    onCancel,
    getVersion
};

从代码上来看RIL_Init函数比较简单，就干了三件事：保存Rild传入的RIL_Env结构体；创建s_tid_mainloop线程，执行函数为mainLoop；返回RIL_RadioFunctions结构体。
这里需要注意的是：RIL_Env和RIL_RadioFunctions结构体，就是Rild架构中用来隔离通用代码和厂商相关代码的接口。即动态库通过RIL_Env调用Rild中的接口，Rild通过RIL_RadioFunctions调用动态库中的接口。

2.1 通信接口
我们先看看RIL_RadioFunctions结构体：

//此处略去函数指针的定义
typedef struct {
    int version;        /* set to RIL_VERSION */
    //用于向BP提交一个请求
    RIL_RequestFunc onRequest;

    //用于查询BP的状态
    RIL_RadioStateRequest onStateRequest;

    //用于判断动态库是否支持某人requestCode
    RIL_Supports supports;

    //用于取消一个提交给BP的请求
    RIL_Cancel onCancel;

    //查询动态库版本
    RIL_GetVersion getVersion;
} RIL_RadioFunctions;

这里需要重点关注的函数是onRequest，它被Rild用来向动态库提交一个请求。
Rild架构采用的是异步请求/处理的通信方式，Rild通过onRequest向动态库提交一个请求，然后返回进行自己的工作；动态库处理这个请求，当处理完请求后，通过回调的方式将结果通知给Rild。

我们再来看看RIL_Env结构体：

struct RIL_Env {
    //动态库完成一个请求后，通过OnRequestComplete通知处理结果，RIL_Token用于标明是哪个请求的处理结果
    void (*OnRequestComplete)(RIL_Token t, RIL_Errno e,
                           void *response, size_t responselen);

    //动态库主动上报时，调用的接口
#if defined(ANDROID_MULTI_SIM)
    void (*OnUnsolicitedResponse)(int unsolResponse, const void *data, size_t datalen, RIL_SOCKET_ID socket_id);
#else
    void (*OnUnsolicitedResponse)(int unsolResponse, const void *data, size_t datalen);
#endif  

    //给rild提交一个超时任务
    void (*RequestTimedCallback) (RIL_TimedCallback callback,
                              void *param, const struct timeval *relativeTime);

    //对于同步的请求，发送应答消息时，使用该接口，目前没看到使用
    void (*OnRequestAck) (RIL_Token t);
}

在RIL_Env的结构体中，主要需要关注的是OnRequestComplete和OnUnsolicitedResponse。

2.2 mainLoop
动态库的RIL_Init被调用后，将会创建一个工作线程，其运行函数为mainLoop：

static void *
mainLoop(void *param __unused)
{
    ........
    //为AT模块设置一些回调函数。
    //对于Reference-Ril库而言，AT模块就是对串口设备通信的封装，用于和BP通信
    at_set_on_reader_closed(onATReaderClosed);
    at_set_on_timeout(onATTimeout);

    for (;;) {
        fd = -1;
        while(fd < 0) {
            //得到串口设备的文件描述符
            .......
        }
        ......
        //打开AT设备，传入回调函数
        ret = at_open(fd, onUnsolicited);
        .......
        //向Rild提交一个超时任务，该任务的处理函数为initializeCallback
        RIL_requestTimedCallback(initializeCallback, NULL, &TIMEVAL_0);
        .......
        //如果AT模块被关闭，则waitForClose返回，但是该线程不会退出，而是从for循环那开始重新执行一次
        //因此AT模块一旦被关闭，将会重新被打开
        waitForClose();
        .......
    }
}

从上面的代码可以看出，mainLoop的工作其实就是初始化并监控AT模块，一但AT模块被关闭，那么mainLoop就要重新打开并初始化它。

2.2.1 at_open

int at_open(int fd, ATUnsolHandler h) 
{
    ........
    pthread_attr_init (&attr);
    pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

    ret = pthread_create(&s_tid_reader, &attr, readerLoop, &attr);
    .........
}

在at_open中创建了一个工作线程，运行函数为readLoop:

static void *readerLoop(void *arg)
{
    for (;;) {
        const char * line;

        //从串口设备读取数据
        line = readline();
        ......
        if(isSMSUnsolicited(line)) {
            .......
            //调用回调函数
            if (s_unsolHandler != NULL) {
                s_unsolHandler (line1, line2);
            }
            .......
        } else {
            //根据line中的数据，调用不同的回调函数
            processLine(line);
        }
    }
    //如果从for循环退出，则通知mainLoop AT设备关闭
    onReaderClosed();
    ...........
}

从上面的代码，我们知道at_open函数其实就是启动一个工作线程，用于接收AT设备的数据，然后进行处理。

2.2.1 initializeCallback
调用at_open后，main利用RIL_requestTimedCallback向Rild发送一个超时任务。

#define RIL_requestTimedCallback(a,b,c) s_rilenv->RequestTimedCallback(a,b,c)

可以看到RIL_requestTimedCallback是一个宏，实际上还是通过RIL_Env中RequestTimedCallback函数发送超时任务。

我们看看ril.cpp中，该函数的实现：

extern "C" void
RIL_requestTimedCallback (RIL_TimedCallback callback, void *param,
                                const struct timeval *relativeTime) {
    internalRequestTimedCallback (callback, param, relativeTime);
}

static UserCallbackInfo *
internalRequestTimedCallback (RIL_TimedCallback callback, void *param,
                        const struct timeval *relativeTime)
{
    struct timeval myRelativeTime;
    UserCallbackInfo *p_info;

    p_info = (UserCallbackInfo *) calloc(1, sizeof(UserCallbackInfo));
    .........
    //回调
    p_info->p_callback = callback;
    //参数
    p_info->userParam = param;

    if (relativeTime == NULL) {
        /* treat null parameter as a 0 relative time */
        memset (&myRelativeTime, 0, sizeof(myRelativeTime));
    } else {
        /* FIXME I think event_add's tv param is really const anyway */
        //时间
        memcpy (&myRelativeTime, relativeTime, sizeof(myRelativeTime));
    }

    //构造ril_event
    ril_event_set(&(p_info->event), -1, false, userTimerCallback, p_info);

    //加入到timer_list中
    ril_timer_add(&(p_info->event), &myRelativeTime);

    //触发EventLoop处理
    triggerEvLoop();
    return p_info;
}

当Rild中的eventLoop处理该超时任务时，就会回调Reference-ril库中的initializeCallback：

static void initializeCallback(void *param __unused)
{
    ........
    //同步radio状态
    setRadioState (RADIO_STATE_OFF);

    //不断地尝试发送AT指令给BP并等待回复，以确定AT channel正常
    at_handshake();

    //下发一系列的AT指令，完成modem初始化
    ..........
}

至此，我们以Reference-ril库为例，分析了RIL_Init函数的基本功能。
如上图所示，RIL_Init的主要工作包括：
1、创建一个mainLoop工作线程，该线程用于完成实际的工作。
2、在mainLoop线程中，通过at_open开启AT模块，同时启动readLoop工作线程。readLoop工作线程负责从AT设备中读取信息，并执行对应的函数调用。
3、调用at_open后，mainLoop线程向Rild进程发送一个超时事件，该事件被Rild处理后，将调用initializeCallback函数。initializeCallback函数，将完成Modem的初始化工作。
其实上，mainLoop可以直接进行Modem初始化的工作；这里发送超时事件给Rild，通过回调进行初始化，可能是为了确保RIL_startEventLoop已经执行成功。
4、mainLoop最后通过waitForClose监控AT模块，一旦AT模块被关闭，mainLoop将重新进行初始化AT模块的工作。

3、RIL_register
现在我们分析一下Rild的main函数中，最后一个关键函数RIL_register：

extern "C" void
RIL_register (const RIL_RadioFunctions *callbacks) {
    .........
    //判断之前是否初始化过
    if (s_registerCalled > 0) {
        RLOGE("RIL_register has been called more than once. "
                "Subsequent call ignored");
        return;
    }
    .........
    /* Initialize socket1 parameters */
    s_ril_param_socket = {
                        RIL_SOCKET_1,             /* socket_id */
                        -1,                       /* fdListen */
                        -1,                       /* fdCommand */
                        PHONE_PROCESS,            /* processName */
                        &s_commands_event,        /* commands_event */
                        &s_listen_event,          /* listen_event */
                        processCommandsCallback,  /* processCommandsCallback */
                        NULL                      /* p_rs */
                        };
    ............
    s_registerCalled = 1;
    ............
    // start listen socket1
    startListen(RIL_SOCKET_1, &s_ril_param_socket);
    //代码中的SIM_COUNT宏并未定义，略去下文
    ...........
}

typedef struct SocketListenParam {
    RIL_SOCKET_ID socket_id;
    int fdListen;
    int fdCommand;
    char* processName;
    struct ril_event* commands_event;
    struct ril_event* listen_event;
    void (*processCommandsCallback)(int fd, short flags, void *param);
    RecordStream *p_rs;
    RIL_SOCKET_TYPE type;
} SocketListenParam;

从上面的代码可以看出，RIL_register实际就是初始化监听socket所需的参数，然后开始监听socket是否有数据到来。

在前面已经提到过，Android中会创建出两个Rild进程，每个Rild进程均会调用RIL_register函数。
虽然s_registerCalled为一个静态变量，但在进程的维度上，它是私有的。因此，每个Rild进程均会成功调用一次RIL_register。

接下来，我们看看startListen函数：

static void startListen(RIL_SOCKET_ID socket_id, SocketListenParam* socket_listen_p) {
    .........
    switch(socket_id) {
        case RIL_SOCKET_1:
            //注意此处的RIL_getRilSocketName
            strncpy(socket_name, RIL_getRilSocketName(), 9);
            break;
        ..........
    }

    //根据socket_name获取对应的文件描述符
    fdListen = android_get_control_socket(socket_name);
    ..............
    //使Rild进程变成被动服务进程
    ret = listen(fdListen, 4);
    ..............
    socket_listen_p->fdListen = fdListen;

    /* note: non-persistent so we can accept only one connection at a time */
    //构造一个非超时任务加，注意persist为false，处理函数为listenCallback
    ril_event_set (socket_listen_p->listen_event, fdListen, false,
                listenCallback, socket_listen_p);

    //加入队列，并trigger
    rilEventAddWakeup (socket_listen_p->listen_event);
}

3.1 RIL_getRilSocketName
startListen函数中，通过调用RIL_getRilSocketName得到需监听的socket的名称。

static char * RIL_getRilSocketName() {
    return rild;
}

RIL_getRilSocketName的内容很简单，就是返回变量rild。
那么rild变量又是何时设置的呢？

对于第一个Rild进程，在ril.cpp中，定义了rild的内容为“rild”。

.........
extern "C"
char rild[MAX_SOCKET_NAME_LENGTH] = SOCKET_NAME_RIL;
........

#define SOCKET_NAME_RIL "rild"

对于第二个Rild进程，在Rild启动后，对应的main函数中，利用RIL_setRilSocketName修改rild的内容：

int main(int argc, char **argv) {
    ........
    //第二个Rild进程，clientId不为0
    if (strncmp(clientId, "0", MAX_CLIENT_ID_LENGTH)) {
        strlcat(rild, clientId, MAX_SOCKET_NAME_LENGTH);
        RIL_setRilSocketName(rild);
    }
    ........
}

extern "C"
void RIL_setRilSocketName(const char * s) {
    strncpy(rild, s, MAX_SOCKET_NAME_LENGTH);
}

从上面的代码，我们可以看出两个Rild进程确实监听的是不同的socket。

3.2 listenCallback
利用listen函数将Rild变成监听进程后，start_listen通过ril_event_set构造了一个非超时的任务，并利用rilEventAddWakeup将该任务加入到watch_table中。
注意到ril_event的fd为待监听的socket，因此当ril_event被加入到watch_table后，该socket对应的fd将被加入到readFds中。

一旦该socket可读（即客户端connect成功），那么eventLoop中的select函数将会返回，执行listenCallback函数。
实际上，由于该任务的persist属性为false，因此执行完毕后，ril_event将从watch_table中移除，socket对应的fd也将被从readFds中移除。
这表明，Rild进程不会再监听socket对应的connect请求，只支持一个客户端的连接，仅会调用一次listenCallback函数。

static void listenCallback (int fd, short flags, void *param) {
    ........
    //保存配置的socket监听参数
    SocketListenParam *p_info = (SocketListenParam *)param;
    ........
    //接收客户端连接，并将返回的socket保存起来
    fdCommand = accept(fd, (sockaddr *) &peeraddr, &socklen);
    //进行权限控制
    ........
    //设置socket为非阻塞的
    ret = fcntl(fdCommand, F_SETFL, O_NONBLOCK);
    ........
    if(NULL == sapSocket) {
        ........
        p_info->fdCommand = fdCommand;
        //为socket分配一个接收缓存
        p_rs = record_stream_new(p_info->fdCommand, MAX_COMMAND_BYTES);
        p_info->p_rs = p_rs;

        //构造一个新的非超时任务，此时persist属性为true（1），于是eventLoop将一致select监听socket是否有数据到来
        //当有数据到来时，将调用processCommandsCallback进行处理
        ril_event_set (p_info->commands_event, p_info->fdCommand, 1,
        p_info->processCommandsCallback, p_info);
        rilEventAddWakeup (p_info->commands_event);

        //向客户端发送主动上报信息，即向RIL.java上报信息
        onNewCommandConnect(p_info->socket_id);
    } else {
        ..........
    }
}

至此，RIL_register的主要工作介绍完毕。从上述分析，我们可以看出RIL_register其实就是创建出与RIL.java通信的服务端socket，然后监听客户端请求。一旦监听到客户端请求后，利用accept分配出对应的通信用socket。然后，再监听该分配出的socket，以处理客户端发来的数据。

4、 Rild main函数总结
现在我们已经分析完Rild main函数的主要流程了，回过头来看看Rild整体的设计思路：

1、利用RIL_startEventLoop，初始化通信框架。不论是初始化AT设备，还是接收来自RIL.java的请求，都依赖于Rild进程的通信架构，因此在main函数的最开始，对通信框架进行了初始化。
2、利用RIL_Init开启AT设备，并完成modem的初始化。AP侧利用RIL.java下发指令，最终还是需要利用AT传给modem来执行。因此，在通信框架初始化完毕后，首先就要完成AT和modem的配置。
3、利用RIL_register将Rild进程变成服务进程，等待RIL.java中socket的连接；连接成功后，开始处理来自RIL.java的数据。

三、实例分析
我们已经分析了Rild进程的工作，现在来结合数据业务拨号，看看实际过程中，Rild的工作情况。

1、RIL.java
首先，在之前的博客中，介绍数据业务基础类的创建时，我们提到过RIL.java在PhoneFactory的makeDefaultPhone中创建：

public static void makeDefaultPhone(Context context) {
    .......
    for (int i = 0; i < numPhones; i++) {
        ........
        sCommandsInterfaces[i] = new RIL(context, networkModes[i],
                cdmaSubscription, i);
    }
    ......  
}

我们看看RIL的构造函数：

public RIL(Context context, int preferredNetworkType, int cdmaSubscription) {
    this(context, preferredNetworkType, cdmaSubscription, null);
}

public RIL(Context context, int preferredNetworkType,
        int cdmaSubscription, Integer instanceId) {
    ........
    mSenderThread = new HandlerThread("RILSender" + mInstanceId);
    mSenderThread.start();

    Looper looper = mSenderThread.getLooper();
    //负责向Rild发送消息
    mSender = new RILSender(looper);

    ConnectivityManager cm = (ConnectivityManager)context.getSystemService(
            Context.CONNECTIVITY_SERVICE);
    if (cm.isNetworkSupported(ConnectivityManager.TYPE_MOBILE) == false) {
        riljLog("Not starting RILReceiver: wifi-only");
    } else {
        ........
        //负责接收Rild发送的消息
        mReceiver = new RILReceiver();
        mReceiverThread = new Thread(mReceiver, "RILReceiver" + mInstanceId);
        mReceiverThread.start();
        ........
    }
    ..........
}

2、 RILReceiver
我们看看RILReceiver相关的函数：

class RILReceiver implements Runnable {
    byte[] buffer;

    RILReceiver() {
        buffer = new byte[RIL_MAX_COMMAND_BYTES];
    }

    @Override
    public void run() {
        int retryCount = 0;
        String rilSocket = "rild";

        try {
            for(;;) {
                LocalSocket s = null;
                LocalSocketAddress l;

                //根据InstanceId决定连接哪个Rild进程的socket
                if (mInstanceId == null || mInstanceId == 0 ) {
                    rilSocket = SOCKET_NAME_RIL[0];
                } else {
                    rilSocket = SOCKET_NAME_RIL[mInstanceId];
                }

                try {
                    s = new LocalSocket();
                    l = new LocalSocketAddress(rilSocket,
                            LocalSocketAddress.Namespace.RESERVED);
                    //连接rild进程
                    s.connect(l);
                } catch(IOException ex) {
                    .........
                }

                retryCount = 0;

                //连接Rild进程socket后，保留创建出的socket
                mSocket = s;

                try {
                    InputStream is = mSocket.getInputStream();

                    for (;;) {
                        Parcel p;

                        //不断读取到来的数据
                        length = readRilMessage(is, buffer);
                        //解析字节流
                        ......
                        //进行处理
                        processResponse(p);
                        ......
                    } catch (java.io.IOException ex) {
                        .......
                    } catch (Throwable tr) {
                        .......
                    }

                    //异常断开，执行关闭socket的操作
                    .......
            }
        } catch (Throwable tr) {
            ..........
        }
    }
    .........
}

从RILReceiver的代码可以看出，其主要功能就是完成与Rild进程中server socket的连接，然后接收并处理Rild进程发来的数据。

3、 setupDataCall
之前的博客介绍数据业务拨号流程时，我们知道在DataConnection中，最终将通过调用RIL的setupDataCall函数，将消息发往modem:

@Override
public void setupDataCall(....) {
    //构造一个request，有唯一的serialNumber，RIL_REQUEST_SETUP_DATA_CALL表明该Request的目的
    RILRequest rr = RILRequest.obtain(RIL_REQUEST_SETUP_DATA_CALL, result);

    //将参数写入到RILRequest的Parcel对象中
    ........

    send(rr);
}

private void send(RILRequest rr) {
    Message msg;

    //RILReceiver中已经创建出mSocket，同时连接了Rild进程
    if (mSocket == null) {
        rr.onError(RADIO_NOT_AVAILABLE, null);
        rr.release();
        return;
    }

    //构造消息发送给RILSender
    msg = mSender.obtainMessage(EVENT_SEND, rr);
    acquireWakeLock(rr, FOR_WAKELOCK);
    msg.sendToTarget();
}

我们看看RILSender：

class RILSender extends Handler implements Runnable {
    .......
    @Override public void
    handleMessage(Message msg) {
        RILRequest rr = (RILRequest)(msg.obj);
        RILRequest req = null;

        switch (msg.what) {
            case EVENT_SEND:
            case EVENT_SEND_ACK:
                try {
                    LocalSocket s;

                    s = mSocket;
                    //将数据打包到data，发往Rild进程
                    .........
                    s.getOutputStream().write(dataLength);
                    s.getOutputStream().write(data);
                    .....
                catch(IOException ex) {
                    .......
                } catch (RuntimeException exc) {
                    .......
                }
                break;
            ........
        }
    }
}

4、processCommandsCallback
根据前面对Rild进程的分析，我们知道当Rild进程收到RIL.java中发送来的数据后，将利用processCommandsCallback进行处理：

static void processCommandsCallback(int fd, short flags, void *param) {
    ............
    for (;;) {
        /* loop until EAGAIN/EINTR, end of stream, or other error */
        //record_stream_get_next将socket中接收的数据全部读取到缓冲区
        //当缓冲区还有数据时，优先解析缓冲区数据；缓冲区无数据时，才从socket再次read
        ret = record_stream_get_next(p_rs, &p_record, &recordlen);

        if (ret == 0 && p_record == NULL) {
            /* end-of-stream */
            break;
        } else if (ret < 0) {
            break;
        } else if (ret == 0) { /* && p_record != NULL */
            //解析出的命令利用processCommandBuffer处理
            processCommandBuffer(p_record, recordlen, p_info->socket_id);
        }
    }
    //错误处理
    ............
}

static int
processCommandBuffer(void *buffer, size_t buflen, RIL_SOCKET_ID socket_id) {
    //判断参数有效性，解析数据等操作
    ..........
    pRI = (RequestInfo *)calloc(1, sizeof(RequestInfo));
    .........
    pRI->token = token;
    //决定了对应的执行函数
    pRI->pCI = &(s_commands[request]);
    pRI->socket_id = socket_id;
    ...........
    pRI->pCI->dispatchFunction(p, pRI);
    return 0;
}

上面的代码中，出现了一个s_commands数组，它保存了一些CommandInfo结构，这个结构封装了Rild对AT指令的处理函数。另外，Rild还定义了一个s_unsolResponses数组，它封装了unsolicited Response对应的一些处理函数。

static CommandInfo s_commands[] = {
#include "ril_commands.h"
};

static UnsolResponseInfo s_unsolResponses[] = {
#include "ril_unsol_commands.h"
};

typedef struct {
    //请求号
    int requestNumber;
    //请求处理函数
    void (*dispatchFunction) (Parcel &p, struct RequestInfo *pRI);
    //结果处理函数
    int(*responseFunction) (Parcel &p, void *response, size_t responselen);
} CommandInfo;

typedef struct {
    int requestNumber;
    int (*responseFunction) (Parcel &p, void *response, size_t responselen);
    WakeType wakeType;
} UnsolResponseInfo;

这里我们重点看一下s_commands数组。
CommandInfo按照requestNumber的先后顺序加入到s_commands中，因此requestNumber就是对应CommandInfo的索引。
我们看看ril_commands.h：

{0, NULL, NULL},
......
{RIL_REQUEST_SETUP_DATA_CALL, dispatchDataCall, responseSetupDataCall},
......

在RIL.java中，指定了拨号对应的请求号为RIL_REQUEST_SETUP_DATA_CALL，因此Rild中对应的处理函数为dispatchDataCall。

5、dispatchDataCall

static void dispatchDataCall(Parcel& p, RequestInfo *pRI) {
    .........
    //转换输入参数后处理
    if (s_callbacks.version < 4 && numParams > numParamsRilV3) {
        ..........
        dispatchStrings(p2, pRI);
    } else {
        .........
        dispatchStrings(p, pRI);
    }
}

static void
dispatchStrings (Parcel &p, RequestInfo *pRI) {
    ........
    startRequest;
    //处理输入参数
    .........
    removeLastChar;
    closeRequest;

    //CALL_ONREQUEST是个宏，实际上调用s_callbacks的onRequest函数
    //s_callbacks的类型为RIL_RadioFunctions，在rild.c的main函数中，利用动态库的RIL_Init函数得到；利用RIL_register函数保存
    CALL_ONREQUEST(pRI->pCI->requestNumber, pStrings, datalen, pRI, pRI->socket_id);
    .............
}

6、onRequest
此处，我们以Reference-ril中的onRequest为例，进行分析：

static void
onRequest (int request, void *data, size_t datalen, RIL_Token t) {
    //判断当前radio状态，是否能够下发AT指令
    .......
    switch (request) {
        .......
        case RIL_REQUEST_SETUP_DATA_CALL:
            //下发AT指令，完成拨号
            requestSetupDataCall(data, datalen, t);
            break;
        .......
    }
}

7、RIL_onRequestComplete
当指令处理完毕后，Reference-ril将调用RIL_onRequestComplete通知RIL.java处理结果。

#define RIL_onRequestComplete(t, e, response, responselen) s_rilenv->OnRequestComplete(t,e, response, responselen)

可以看到RIL_onRequestComplete是一个宏，实际上调用的是s_rilenv的OnRequestComplete函数。
在Rild进程的main函数中，调用RIL_Init时传入了s_rilEnv，我们看看ril.cpp中的RIL_onRequestComplete：

extern "C" void
RIL_onRequestComplete(RIL_Token t, RIL_Errno e, void *response, size_t responselen) {
    ........
    //从参数中，知道请求是从哪个socket发过来的
    socket_id = pRI->socket_id;
    fd = findFd(socket_id);
    ........
    if (pRI->cancelled == 0) {
        ........
        if (response != NULL) {
            // there is a response payload, no matter success or not.
            //调用responseDataCall，在返回结果中加入ip地址等信息
            ret = pRI->pCI->responseFunction(p, response, responselen);
            ........
        }
        ........
        sendResponse(p, socket_id);
    }
    ........
}

static int
sendResponse (Parcel &p, RIL_SOCKET_ID socket_id) {
    printResponse;
    //利用write函数，将数据发往RIL.java
    return sendResponseRaw(p.data(), p.dataSize(), socket_id);
}

8、processResponse
在前面介绍RILReceiver时，我们知道RILReceiver与Rild连接成功后，将会一直监听发来的数据，并调用processResponse进行处理。

private void
processResponse (Parcel p) {
    int type;

    type = p.readInt();

    if (type == RESPONSE_UNSOLICITED || type == RESPONSE_UNSOLICITED_ACK_EXP) {
        //处理主动上报
        processUnsolicited (p, type);
    } else if (type == RESPONSE_SOLICITED || type == RESPONSE_SOLICITED_ACK_EXP) {
        RILRequest rr = processSolicited (p, type);
        .......
    } else if (type == RESPONSE_SOLICITED_ACK) {
        .......
    }
}

private RILRequest
processSolicited (Parcel p, int type) {
    .......
    //根据serialNumber，将队列中的记录移除
    rr = findAndRemoveRequestFromList(serial);
    .......
    if (error == 0 || p.dataAvail() > 0) {
        try {switch (rr.mRequest) {
        ........
        case RIL_REQUEST_SETUP_DATA_CALL: ret =  responseSetupDataCall(p); break;
        ........
        }
        ....
    }
    .......
    if (error == 0) {
        .......
        if (rr.mResult != null) {
            AsyncResult.forMessage(rr.mResult, ret, null);
            //将结果返回给DataConnection
            rr.mResult.sendToTarget();
        }
    }
    .......
}

在理解了Rild搭建的通信架构后，分析底层拨号的流程还是比较简单的。

转载声明：本文系转载，原文地址：https://www.2cto.com/kf/201609/549285.html

Android7.0 Rild工作流程 - Android移动开发技术文章_手机开发 -

Recommend

如何写好一篇技术文章？

2017上半年技术文章集合—184篇文章分类汇总

技术文章如何写，才能有较好的阅读体验？

调用系统相机、相册、剪裁图片并上传（常用于上传头像，兼容Android7.0）

BloStack - BloStack 专注区块链领域的技术文章分享、人才招聘、项目外包及融资等动向...

哪些网站或软件可以看到高质量的英语技术文章？

Android7以上证书安装

pip：带你认识一个 Python 开发工作流程中的重要工具

Java开发学习(十五)----AOP入门案例及其工作流程解析 - |旧市拾荒|

手机淘宝前端的图片相关工作流程梳理

About Joyk