最新线程池介绍论文(2)

2020-06-24实用文

线程池与连接池

　　连接池通常实现在Client端，是指应用(客户端)创建预先创建一定的连接，利用这些连接服务于客户端所有的DB请求。如果某一个时刻，空闲的连接数小于DB的请求数，则需要将请求排队，等待空闲连接处理。通过连接池可以复用连接，避免连接的频繁创建和释放，从而减少请求的平均响应时间，并且在请求繁忙时，通过请求排队，可以缓冲应用对DB的冲击。线程池实现在server端，通过创建一定数量的线程服务DB请求，相对于one-conection-per-thread的一个线程服务一个连接的方式，线程池服务的最小单位是语句，即一个线程可以对应多个活跃的连接。通过线程池，可以将server端的服务线程数控制在一定的范围，减少了系统资源的竞争和线程上下文切换带来的消耗，同时也避免出现高连接数导致的高并发问题。连接池和线程池相辅相成，通过连接池可以减少连接的创建和释放，提高请求的平均响应时间，并能很好地控制一个应用的DB连接数，但无法控制整个应用集群的连接数规模，从而导致高连接数，通过线程池则可以很好地应对高连接数，保证server端能提供稳定的服务。如图2所示，每个web-server端维护了3个连接的.连接池，对于连接池的每个连接实际不是独占db-server的一个worker，而是可能与其他连接共享。这里假设db-server只有3个group，每个group只有一个worker，每个worker处理了2个连接的请求。

线程池优化

　　1.调度死锁解决

　　引入线程池解决了多线程高并发的问题，但也带来一个隐患。假设，A，B两个事务被分配到不同的group中执行，A事务已经开始，并且持有锁，但由于A所在的group比较繁忙，导致A执行一条语句后，不能立即获得调度执行；而B事务依赖A事务释放锁资源，虽然B事务可以被调度起来，但由于无法获得锁资源，导致仍然需要等待，这就是所谓的调度死锁。由于一个group会同时处理多个连接，但多个连接不是对等的。比如，有的连接是第一次发送请求；而有的连接对应的事务已经开启，并且持有了部分锁资源。为了减少锁资源争用，后者显然应该比前者优先处理，以达到尽早释放锁资源的目的。因此在group里面，可以添加一个优先级队列，将已经持有锁的连接，或者已经开启的事务的连接发起的请求放入优先队列，工作线程首先从优先队列获取任务执行。

　　2.大查询处理

　　假设一种场景，某个group里面的连接都是大查询，那么group里面的工作线程数很快就会达到thread_pool_oversubscribe参数设置值，对于后续的连接请求，则会响应不及时(没有更多的连接来处理)，这时候group就发生了stall。通过前面分析知道，timer线程会定期检查这种情况，并创建一个新的worker线程来处理请求。如果长查询来源于业务请求，则此时所有group都面临这种问题，此时主机可能会由于负载过大，导致hang住的情况。这种情况线程池本身无能为力，因为源头可能是烂SQL并发，或者SQL没有走对执行计划导致，通过其他方法，比如SQL高低水位限流或者SQL过滤手段可以应急处理。但是，还有另外一种情况，就是dump任务。很多下游依赖于数据库的原始数据，通常通过dump命令将数据拉到下游，而这种dump任务通常都是耗时比较长，所以也可以认为是大查询。如果dump任务集中在一个group内，并导致其他正常业务请求无法立即响应，这个是不能容忍的，因为此时数据库并没有压力，只是因为采用了线程池策略，才导致了请求响应不及时，为了解决这个问题，我们将group中处理dump任务的线程不计入thread_pool_oversubscribe累计值，避免上述问题。

　　one-connection-per-thread

　　根据scheduler_functions的模板，我们也可以列出one-connection-per-thread方式的几个关键函数。

　　static scheduler_functions con_per_functions= { max_connection+1, // max_threads NULL, NULL, NULL, // init Init_new_connection_handler_thread, // init_new_connection_thread create_thread_to_handle_connection, // add_connection NULL, // thd_wait_begin NULL, // thd_wait_end NULL, // post_kill_notification one_thread_per_connection_end, // end_thread NULL // end };

　　1.init_new_connection_handler_thread

　　这个接口比较简单，主要是调用pthread_detach，将线程设置为detach状态，线程结束后自动释放所有资源。

　　2.create_thread_to_handle_connection

　　这个接口是处理新连接的接口，对于线程池而言，会从thread_id%group_size对应的group中获取一个线程来处理，而one-connection-per-thread方式则会判断是否有thread_cache可以使用，如果没有则新建线程来处理。具体逻辑如下：

　　(1).判断缓存的线程数是否使用完(比较blocked_pthread_count 和wake_pthread大小)

　　(2).若还有缓存线程，将thd加入waiting_thd_list的队列，唤醒一个等待COND_thread_cache的线程

　　(3).若没有，创建一个新的线程处理,线程的入口函数是do_handle_one_connection

　　(4).调用add_global_thread加入thd数组。

　　3.do_handle_one_connection

　　这个接口被create_thread_to_handle_connection调用，处理请求的主要实现接口。

　　(1).循环调用do_command，从socket中读取网络包，并且解析执行；

　　(2). 当远程客户端发送关闭连接COMMAND(比如COM_QUIT，COM_SHUTDOWN)时，退出循环

　　(3).调用close_connection关闭连接(thd->disconnect());

　　(4).调用one_thread_per_connection_end函数,确认是否可以复用线程

　　(5).根据返回结果，确定退出工作线程还是继续循环执行命令。

　　4.one_thread_per_connection_end

　　判断是否可以复用线程(thread_cache)的主要函数,逻辑如下：

　　(1).调用remove_global_thread，移除线程对应的thd实例

　　(2).调用block_until_new_connection判断是否可以重用thread

　　(3).判断缓存的线程是否超过阀值，若没有，则blocked_pthread_count++;

　　(4).阻塞等待条件变量COND_thread_cache

　　(5).被唤醒后，表示有新的thd需要重用线程，将thd从waiting_thd_list中移除，使用thd初始化线程的thd->thread_stack

　　(6).调用add_global_thread加入thd数组。

　　(7).如果可以重用，返回false，否则返回ture

首页

尾页

上一篇：改写拟人句练习语句下一篇：多线程人生的杂文随笔