其实关于共享栈是否真的节约了内存我还是认为存疑的。
无论malloc分配还是mmap分配协程栈,空间确实向内核要了,但内核并不会真正把物理内存映射上去,这意味着哪怕你一口气申请了100MB空间,也只有当实际使用时触发缺页中断,内核才会正儿八经把物理内存映射进去。作为栈使用的内存就是自底向上(地址由大到小)连续访问的,栈顶也就是最小使用到的位置了。我们自己的协程库实现里,默认一个协程拿8MB栈,起几万个协程的测试进程跑起来看RSS也不会真就吃掉百GB内存。
真要省内存,哪怕在调度过程中用madvise释放掉一些用不着的空间,也比限制着栈大小的共享栈来得更有效率。
更何况栈上空间也是可以取地址取引用的,基于复制的共享栈会影响跨协程的栈上引用的使用,这是正儿八经的副作用了。
顺带提一嘴,不少开源协程库的上下文交换时都会去保存一把SIMD相关的寄存器。这实在是有点奇怪:协程又不是抢占式调度,实在是没有机会在一个仍在跑SIMD指令且没有得到结果的情况下去切换上下文,这些状态的保存就缺乏意义。ucontext这一类的实现里界定词是上下文切换而非协程切换,存一存说得过去,专门一个协程库就实在没必要这么做了,只需要保存callee。这一点libco就是完全按照psABI实现的,比其他几个协程库明显更靠谱。
看了半天,原来就是栈空间共享,切换的时候用内存拷贝把栈内容给拷贝到共享的栈空间来??
我还以为会有栈底复用这样高端的技术呢……
我知道很多人会看得云里雾里,虽然我不保证我的理解一定正确,但如果我理解正确的话,这个事情非常简单。
你只要搞明白一件事情,不管是线程还是协程(有栈的),栈空间通常是预留了一个固定大小的。
在栈上面分配变量啊参数什么东西,就是把栈顶指针往后面推。这样做的好处是在栈上分配和释放速度巨快,因为直接把栈顶指针往前推往后推就完事了。
但最大的弊病就是我们得预留一大块内存来作为栈空间,这一块内存不能挪作他用。栈也很难动态扩容,因为这涉及到栈地址变化,栈指针都会挂掉。当在栈上分配内存导致栈顶指针超出了栈空间预留大小的时候,就是喜闻乐见的爆栈了(StackOverflow)。
而共享栈说白了就是栈空间是同一块内存地址,每次切换的时候都把栈空间备份和还原……好处是备份还原的时候不是整个栈空间,只是被用到的空间,所以可以省内存。