channel和ram的区别（一文读懂channel设计）

小君 2022-12-07 09:46:21 519

channel和ram的区别（一文读懂channel设计）从内存的角度而言，并发模型只分两种：基于共享内存和基于消息通信（内存拷贝）。在Go中，两种并发模型的同步原语均有提供：sync.*和atomic.*代表的就是基于共享内存；channel代表的就是基于消息通信。而Go提倡后者，它包括三大元素：goroutine（执行体），channel（通信），select（协调）。channel的存在定位多线程的并发方式，相较于多进程而言要快得多。但是由于线程上下文切换总是不可避免的陷入内核态，它的开销依然较大。那么有没有不必陷入内核态的运行载体呢？有，用户级线程。用户级线程的切换由用户程序自己控制，不需要内核干涉，因此少了进出内核态的消耗。这里的用户级线程就是协程（coroutine），它们的切换由运行时系统来统一调度管理，内核态并不知道它的存在。协程是抽象于内核线程之上的对象，一个内核线程可以对应多个协程。但最终的系统调用仍然需要内核线程来完成。注意

在Go中，要理解channel，首先需要认识goroutine。

为什么会有goroutine？

现代操作系统中为我们提供了三种基本的构造并发程序的方法：多进程、I/O多路复用和多线程。其中最简单的构造方式当属多进程，但是多进程的并发程序，由于对进程控制和进程间通信开销巨大，这样的并发方式往往会很慢。

因此，操作系统提供了更小粒度的运行单元：线程（确切叫法是内核线程）。它是一种运行在进程上下文中的逻辑流，线程之间通过操作系统来调度，其调度模型如下图所示。

channel和ram的区别（一文读懂channel设计）(1)

多线程的并发方式，相较于多进程而言要快得多。但是由于线程上下文切换总是不可避免的陷入内核态，它的开销依然较大。那么有没有不必陷入内核态的运行载体呢？有，用户级线程。用户级线程的切换由用户程序自己控制，不需要内核干涉，因此少了进出内核态的消耗。

channel和ram的区别（一文读懂channel设计）(2)

这里的用户级线程就是协程（coroutine），它们的切换由运行时系统来统一调度管理，内核态并不知道它的存在。协程是抽象于内核线程之上的对象，一个内核线程可以对应多个协程。但最终的系统调用仍然需要内核线程来完成。注意，线程的调度是操作系统来管理，是一种抢占式调度。而协程不同，协程之间需要合作，会主动交出执行权，是一种协作式调度，这也是为何被称为协程的原因。

Go天生在语言层面支持了协程，即我们常说的goroutine。Go的runtime系统实现的是一种M:N调度模型，通过GMP对象来描述，其中G代表的就是协程，M是线程，P是调度上下文。在Go程序中，一个goroutine就代表着一个最小用户代码执行流，它们也是并发流的最小单元。

channel的存在定位

从内存的角度而言，并发模型只分两种：基于共享内存和基于消息通信（内存拷贝）。在Go中，两种并发模型的同步原语均有提供：sync.*和atomic.*代表的就是基于共享内存；channel代表的就是基于消息通信。而Go提倡后者，它包括三大元素：goroutine（执行体），channel（通信），select（协调）。

Do not communicate by sharing memory; instead share memory by communicating.

在Go中通过goroutine channel的方式，可以简单、高效地解决并发问题，channel就是goroutine之间的数据桥梁。

Concurrency is the key to designing high performance network services. Go's concurrency primitives (goroutines and channels) provide a simple and efficient means of expressing concurrent execution.

以下是一个简单的channel使用示例代码。

1funcgoroutineA(ch<-chanint){ 2fmt.Println("[goroutineA]wantadata") 3val:=<-ch 4fmt.Println("[goroutineA]receivedthedata" val) 5} 6 7funcgoroutineB(chchan<-int){ 8time.Sleep(time.Second*1) 9ch<-1 10fmt.Println("[goroutineB]sendthedata1") 11} 12 13funcmain(){ 14ch:=make(chanint 1) 15gogoroutineA(ch) 16gogoroutineB(ch) 17time.Sleep(2*time.Second) 18}

上述过程趣解图如下

channel和ram的区别（一文读懂channel设计）(3)

channel和ram的区别（一文读懂channel设计）(4)

channel和ram的区别（一文读懂channel设计）(5)

channel和ram的区别（一文读懂channel设计）(6)

channel源码解析

channel源码位于src/go/runtime/chan.go。本章内容分为两部分：channel内部结构和channel操作。

1. channel内部结构

1ch:=make(chanint 2)

对于以上channel的申明语句，我们可以在程序中加入断点，得到ch的信息如下。

channel和ram的区别（一文读懂channel设计）(7)

很好，看起来非常的清晰。但是，这些信息代表的是什么含义呢？接下来，我们先看几个重要的结构体。

hchan

当我们通过make(chan Type size)生成channel时，在runtime系统中，生成的是一个hchan结构体对象。源码位于src/runtime/chan.go

1typehchanstruct{ 2qcountuint//循环队列中数据数 3dataqsizuint//循环队列的大小 4bufunsafe.Pointer//指向大小为dataqsize的包含数据元素的数组指针 5elemsizeuint16//数据元素的大小 6closeduint32//代表channel是否关闭 7elemtype*_type//_type代表Go的类型系统，elemtype代表channel中的元素类型 8sendxuint//发送索引号，初始值为0 9recvxuint//接收索引号，初始值为0 10recvqwaitq//接收等待队列，存储试图从channel接收数据(<-ch)的阻塞goroutines 11sendqwaitq//发送等待队列，存储试图发送数据(ch<-)到channel的阻塞goroutines 12 13lockmutex//加锁能保护hchan的所有字段，包括waitq中sudoq对象 14}

waitq

waitq用于表达处于阻塞状态的goroutines链表信息，first指向链头goroutine，last指向链尾goroutine。

1typewaitqstruct{ 2first*sudog 3last*sudog 4}

sudug

sudog代表的就是一个处于等待列表中的goroutine对象，源码位于src/runtime/runtime2.go

1typesudogstruct{ 2g*g 3next*sudog 4prev*sudog 5elemunsafe.Pointer//dataelement(maypointtostack) 6c*hchan//channel 7... 8}

为了更好理解hchan结构体，我们将通过以下代码来理解hchan中的字段含义。

1packagemain 2 3import"time" 4 5funcgoroutineA(chchanint){ 6ch<-100 7} 8 9funcgoroutineB(chchanint){ 10ch<-200 11} 12 13funcgoroutineC(chchanint){ 14ch<-300 15} 16 17funcgoroutineD(chchanint){ 18ch<-300 19} 20 21funcmain(){ 22ch:=make(chanint 4) 23fori:=0;i<4;i { 24ch<-i*10 25} 26gogoroutineA(ch) 27gogoroutineB(ch) 28gogoroutineC(ch) 29gogoroutineD(ch) 30//第一个sleep是为了给上足够的时间让所有goroutine都已启动 31time.Sleep(time.Millisecond*500) 32time.Sleep(time.Second) 33}

打开代码调试功能，将程序运行至断点time.Sleep(time.Second)处，此时得到的chan信息如下。

channel和ram的区别（一文读懂channel设计）(8)

在该channel中，通过make(chan int 4)定义的channel大小为4，即dataqsiz的值为4。同时由于循环队列中已经添加了4个元素，所以qcount值也为4。此时，有4个goroutine（A-D）想发送数据给channel，但是由于存放数据的循环队列已满，所以只能进入发送等待列表，即sendq。同时要注意到，此时的发送和接收索引值均为0，即下一次接收数据的goroutine会从循环队列的第一个元素拿，发送数据的goroutine会发送到循环队列的第一个位置。

上述hchan结构可视化图解如下

channel和ram的区别（一文读懂channel设计）(9)

2. channel操作

将channel操作分为四部分：创建、发送、接收和关闭。

创建

本文的参考Go版本为1.15.2。其channel的创建实现代码位于src/go/runtime/chan.go的makechan方法。

1funcmakechan(t*chantype sizeint)*hchan{ 2elem:=t.elem 3 4//发送元素大小限制 5ifelem.size>=1<<16{ 6throw("makechan:invalidchannelelementtype") 7} 8//对齐检查 9ifhchanSize%maxAlign!=0||elem.align>maxAlign{ 10throw("makechan:badalignment") 11} 12 13//判断是否会内存溢出 14mem overflow:=math.MulUintptr(elem.size uintptr(size)) 15ifoverflow||mem>maxAlloc-hchanSize||size<0{ 16panic(plainError("makechan:sizeoutofrange")) 17} 18 19//为构造的hchan对象分配内存 20varc*hchan 21switch{ 22//无缓冲的channel或者元素大小为0的情况 23casemem==0: 24c=(*hchan)(mallocgc(hchanSize nil true)) 25c.buf=c.raceaddr() 26//元素不包含指针的情况 27caseelem.ptrdata==0: 28c=(*hchan)(mallocgc(hchanSize mem nil true)) 29c.buf=add(unsafe.Pointer(c) hchanSize) 30//元素包含指针 31default: 32c=new(hchan) 33c.buf=mallocgc(mem elem true) 34} 35 36//初始化相关参数 37c.elemsize=uint16(elem.size) 38c.elemtype=elem 39c.dataqsiz=uint(size) 40lockInit(&c.lock lockRankHchan) 41 42ifdebugChan{ 43print("makechan:chan=" c ";elemsize=" elem.size ";dataqsiz=" size "\n") 44} 45returnc 46}

可以看到，makechan方法主要就是检查传送元素的合法性，并为hchan分配内存，初始化相关参数，包括对锁的初始化。

发送

channel的发送实现代码位于src/go/runtime/chan.go的chansend方法。发送过程，存在以下几种情况。

a. 当发送的channel为nil

1ifc==nil{ 2if!block{ 3returnfalse 4} 5gopark(nil nil waitReasonChanSendNilChan traceEvGoStop 2) 6throw("unreachable") 7}

往一个nil的channel中发送数据时，调用gopark函数将当前执行的goroutine从running态转入waiting态。

b. 往已关闭的channel中发送数据

1ifc.closed!=0{ 2unlock(&c.lock) 3panic(plainError("sendonclosedchannel")) 4}

如果向已关闭的channel中发送数据，会引发panic。

c. 如果已经有阻塞的接收goroutines（即recvq中指向非空），那么数据将被直接发送给接收goroutine

1ifsg:=c.recvq.dequeue();sg!=nil{ 2//Foundawaitingreceiver.Wepassthevaluewewanttosend 3//directlytothereceiver bypassingthechannelbuffer(ifany). 4send(c sg ep func(){unlock(&c.lock)} 3) 5returntrue 6}

该逻辑的实现代码在send方法和sendDirect中。

1funcsend(c*hchan sg*sudog epunsafe.Pointer unlockffunc() skipint){ 2...//省略了竞态代码 3ifsg.elem!=nil{ 4sendDirect(c.elemtype sg ep) 5sg.elem=nil 6} 7gp:=sg.g 8unlockf() 9gp.param=unsafe.Pointer(sg) 10ifsg.releasetime!=0{ 11sg.releasetime=cputicks() 12} 13goready(gp skip 1) 14} 15 16funcsendDirect(t*_type sg*sudog srcunsafe.Pointer){ 17dst:=sg.elem 18typeBitsBulkBarrier(t uintptr(dst) uintptr(src) t.size) 19memmove(dst src t.size) 20}

其中，memmove我们已经在源码系列中遇到多次了，它的目的是将内存中src的内容拷贝至dst中去。另外，注意到goready(gp skip 1)这句代码，它会使得之前在接收等待队列中的第一个goroutine的状态变为runnable，这样go的调度器就可以重新让该goroutine得到执行。

d. 对于有缓冲的channel来说，如果当前缓冲区hchan.buf有可用空间，那么会将数据拷贝至缓冲区

1ifc.qcount<c.dataqsiz{ 2qp:=chanbuf(c c.sendx) 3ifraceenabled{ 4raceacquire(qp) 5racerelease(qp) 6} 7typedmemmove(c.elemtype qp ep) 8//发送索引号 1 9c.sendx 10//因为存储数据元素的结构是循环队列，所以当当前索引号已经到队末时，将索引号调整到队头 11ifc.sendx==c.dataqsiz{ 12c.sendx=0 13} 14//当前循环队列中存储元素数 1 15c.qcount 16unlock(&c.lock) 17returntrue 18}

其中，chanbuf(c c.sendx)是获取指向对应内存区域的指针。typememmove会调用memmove方法，完成数据的拷贝工作。另外注意到，当对hchan进行实际操作时，是需要调用lock(&c.lock)加锁，因此，在完成数据拷贝后，通过unlock(&c.lock)将锁释放。

e. 有缓冲的channel，当hchan.buf已满；或者无缓冲的channel，当前没有接收的goroutine

1gp:=getg() 2mysg:=acquireSudog() 3mysg.releasetime=0 4ift0!=0{ 5mysg.releasetime=-1 6} 7//Nostacksplitsbetweenassigningelemandenqueuingmysg 8//ongp.waitingwherecopystackcanfindit. 9mysg.elem=ep 10mysg.waitlink=nil 11mysg.g=gp 12mysg.isSelect=false 13mysg.c=c 14gp.waiting=mysg 15gp.param=nil 16c.sendq.enqueue(mysg) 17gopark(chanparkcommit unsafe.Pointer(&c.lock) waitReasonChanSend traceEvGoBlockSend 2)

通过getg获取当前执行的goroutine。acquireSudog是先获得当前执行goroutine的线程M，再获取M对应的P，最后将P的sudugo缓存队列中的队头sudog取出（详见源码src/runtime/proc.go）。通过c.sendq.enqueue将sudug加入到channel的发送等待列表中，并调用gopark将当前goroutine转为waiting态。

发送操作会对hchan加锁。
当recvq中存在等待接收的goroutine时，数据元素将会被直接拷贝给接收goroutine。
当recvq等待队列为空时，会判断hchan.buf是否可用。如果可用，则会将发送的数据拷贝至hchan.buf中。
如果hchan.buf已满，那么将当前发送goroutine置于sendq中排队，并在运行时中挂起。
向已经关闭的channel发送数据，会引发panic。

对于无缓冲的channel来说，它天然就是hchan.buf已满的情况，因为它的hchan.buf的容量为0。

1packagemain 2 3import"time" 4 5funcmain(){ 6ch:=make(chanint) 7gofunc(chchanint){ 8ch<-100 9}(ch) 10time.Sleep(time.Millisecond*500) 11time.Sleep(time.Second) 12}

在上述示例中，发送goroutine向无缓冲的channel发送数据，但是没有接收goroutine。将断点置于time.Sleep(time.Second)，得到此时ch结构如下。

channel和ram的区别（一文读懂channel设计）(10)

可以看到，在无缓冲的channel中，其hchan的buf长度为0，当没有接收groutine时，发送的goroutine将被置于sendq的发送队列中。

接收

channel的接收实现分两种，v :=<-ch对应于chanrecv1，v ok := <- ch对应于chanrecv2，但它们都依赖于位于src/go/runtime/chan.go的chanrecv方法。

1funcchanrecv1(c*hchan elemunsafe.Pointer){ 2chanrecv(c elem true) 3} 4 5funcchanrecv2(c*hchan elemunsafe.Pointer)(receivedbool){ 6_ received=chanrecv(c elem true) 7return 8}

chanrecv的详细代码此处就不再展示，和chansend逻辑对应，具体处理准则如下。

接收操作会对hchan加锁。
当sendq中存在等待发送的goroutine时，意味着此时的hchan.buf已满（无缓存的天然已满），分两种情况（见代码src/go/runtime/chan.go的recv方法）：1. 如果是有缓存的hchan，那么先将缓冲区的数据拷贝给接收goroutine，再将sendq的队头sudog出队，将出队的sudog上的元素拷贝至hchan的缓存区。2. 如果是无缓存的hchan，那么直接将出队的sudog上的元素拷贝给接收goroutine。两种情况的最后都会唤醒出队的sudog上的发送goroutine。
当sendq发送队列为空时，会判断hchan.buf是否可用。如果可用，则会将hchan.buf的数据拷贝给接收goroutine。
如果hchan.buf不可用，那么将当前接收goroutine置于recvq中排队，并在运行时中挂起。
与发送不同的是，当channel关闭时，goroutine还能从channel中获取数据。如果recvq等待列表中有goroutines，那么它们都会被唤醒接收数据。如果hchan.buf中还有未接收的数据，那么goroutine会接收缓冲区中的数据，否则goroutine会获取到元素的零值。

以下是channel关闭之后，接收goroutine的读取示例代码。

1funcmain(){ 2ch:=make(chanint 1) 3ch<-10 4close(ch) 5a ok:=<-ch 6fmt.Println(a ok) 7b ok:=<-ch 8fmt.Println(b ok) 9c:=<-ch 10fmt.Println(c) 11} 12 13//输出如下 1410true 150false 160

注意：在channel中进行的所有元素转移都伴随着内存的拷贝。

1funcmain(){ 2typeInstancestruct{ 3IDint 4namestring 5} 6 7varins=Instance{ID:1 name:"Golang"} 8 9ch:=make(chanInstance 3) 10ch<-ins 11 12fmt.Println("ins的原始值：" ins) 13 14ins.name="Python" 15gofunc(chchanInstance){ 16fmt.Println("channel接收值：" <-ch) 17}(ch) 18 19time.Sleep(time.Second) 20fmt.Println("ins的最终值：" ins) 21} 22 23//输出结果 24ins的原始值：{1Golang} 25channel接收值：{1Golang} 26ins的最终值：{1Python}

前半段图解如下

channel和ram的区别（一文读懂channel设计）(11)

后半段图解如下

channel和ram的区别（一文读懂channel设计）(12)

注意: 如果把channel传递类型替换为Instance指针时，那么尽管channel存入到buf中的元素已经是拷贝对象了，从channel中取出又被拷贝了一次。但是由于它们的类型是Instance指针，拷贝对象与原始对象均会指向同一个内存地址，修改原有元素对象的数据时，会影响到取出数据。

1funcmain(){ 2typeInstancestruct{ 3IDint 4namestring 5} 6 7varins=&Instance{ID:1 name:"Golang"} 8 9ch:=make(chan*Instance 3) 10ch<-ins 11 12fmt.Println("ins的原始值：" ins) 13 14ins.name="Python" 15gofunc(chchan*Instance){ 16fmt.Println("channel接收值：" <-ch) 17}(ch) 18 19time.Sleep(time.Second) 20fmt.Println("ins的最终值：" ins) 21} 22 23//输出结果 24ins的原始值：&{1Golang} 25channel接收值：&{1Python} 26ins的最终值：&{1Python}

因此，在使用channel时，尽量避免传递指针，如果传递指针，则需谨慎。

关闭

channel的关闭实现代码位于src/go/runtime/chan.go的chansend方法，详细执行逻辑已通过注释写明。

1funcclosechan(c*hchan){ 2//如果hchan对象为nil，则会引发painc 3ifc==nil{ 4panic(plainError("closeofnilchannel")) 5} 6 7//对hchan加锁 8lock(&c.lock) 9//不同多次调用close(cchan<-Type)方法，否则会引发painc 10ifc.closed!=0{ 11unlock(&c.lock) 12panic(plainError("closeofclosedchannel")) 13} 14 15ifraceenabled{ 16callerpc:=getcallerpc() 17racewritepc(c.raceaddr() callerpc funcPC(closechan)) 18racerelease(c.raceaddr()) 19} 20 21//close标志 22c.closed=1 23 24//gList代表Go的GMP调度的G集合 25varglistgList 26 27//该for循环是为了释放recvq上的所有等待接收sudog 28for{ 29sg:=c.recvq.dequeue() 30ifsg==nil{ 31break 32} 33ifsg.elem!=nil{ 34typedmemclr(c.elemtype sg.elem) 35sg.elem=nil 36} 37ifsg.releasetime!=0{ 38sg.releasetime=cputicks() 39} 40gp:=sg.g 41gp.param=nil 42ifraceenabled{ 43raceacquireg(gp c.raceaddr()) 44} 45glist.push(gp) 46} 47 48//该for循环会释放sendq上的所有等待发送sudog 49for{ 50sg:=c.sendq.dequeue() 51ifsg==nil{ 52break 53} 54sg.elem=nil 55ifsg.releasetime!=0{ 56sg.releasetime=cputicks() 57} 58gp:=sg.g 59gp.param=nil 60ifraceenabled{ 61raceacquireg(gp c.raceaddr()) 62} 63glist.push(gp) 64} 65//释放sendq和recvq之后，hchan释放锁 66unlock(&c.lock) 67 68//将上文中glist中的加入的goroutine取出，让它们均变为runnable（可执行）状态，等待调度器执行 69//注意：我们上文中分析过，试图向一个已关闭的channel发送数据，会引发painc。 70//所以，如果是释放sendq中的goroutine，它们一旦得到执行将会引发panic。 71for!glist.empty(){ 72gp:=glist.pop() 73gp.schedlink=0 74goready(gp 3) 75} 76}

关于关闭操作，有几个点需要注意一下。

如果关闭已关闭的channel会引发painc。
对channel关闭后，如果有阻塞的读取或发送goroutines将会被唤醒。读取goroutines会获取到hchan的已接收元素，如果没有，则获取到元素零值；发送goroutine的执行则会引发painc。

对于第二点，我们可以很好利用这一特性来实现对程序执行流的控制（类似于sync.WaitGroup的作用），以下是示例程序代码。

1funcmain(){ 2ch:=make(chanstruct{}) 3// 4gofunc(){ 5//dosomethingwork... 6//whenworkhasdone callclose() 7close(ch) 8}() 9//waitingworkdone 10<-ch 11//otherworkcontinue... 12}

总结

channel是Go中非常强大有用的机制，为了更有效地使用它，我们必须了解它的实现原理，这也是写作本文的目的。

hchan结构体有锁的保证，对于并发goroutine而言是安全的
channel接收、发送数据遵循FIFO（First In First Out）原语
channel的数据传递依赖于内存拷贝
channel能阻塞（gopark）、唤醒（goready）goroutine
所谓无缓存的channel，它的工作方式就是直接发送goroutine拷贝数据给接收goroutine，而不通过hchan.buf

另外，可以看到Go在channel的设计上权衡了简单与性能。为了简单性，hchan是有锁的结构，因为有锁的队列会更易理解和实现，但是这样会损失一些性能。考虑到整个 channel 操作带锁的成本较高，其实官方也曾考虑过使用无锁 channel 的设计，但是由于目前已有提案中（https://github.com/golang/go/issues/8899），无锁实现的channel可维护性差、且实际性能测试不具有说服力，而且也不符合Go的简单哲学，因此官方目前为止并没有采纳无锁设计。

在性能上，有一点，我们需要认识到：所谓channel中阻塞goroutine，只是在runtime系统中被blocked，它是用户层的阻塞。而实际的底层内核线程不受影响，它仍然是unblocked的。

参考链接

https://speakerdeck.com/kavya719/understanding-channels

https://codeburst.io/diving-deep-into-the-golang-channels-549fd4ed21a8

https://github.com/talkgo/night/issues/450

来源 | Golang技术分享

作者 | 机器铃砍菜刀

网站首页

返回栏目

channel和ram的区别（一文读懂channel设计）

猜您喜欢：

相关文章